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高 级 语言 程序 设计 、 数 据 结构 、 算 法 设计 与 分 析 构 成 了 程序 设计 理论 底层 的 黄金 三 角 
形 。 高 级 语言 程序 设计 偏重 语法 的 描述 和 程序 设计 细节 等 能 力 培养 ,数据 结构 重点 讨论 程 
序 设计 中 如 何 分 析 、 规 划 、 存 储 和 实现 相关 的 数据 以 及 关系 ,算法 设计 与 分 析 则 偏重 解 题 思 
路 的 实现 。 大 部 分 算法 设计 首先 依赖 数据 结构 的 构造 ,这 将 深远 影响 到 程序 的 时 间 效率 和 
空间 效率 ,以 及 程序 结构 的 合理 性 和 程序 阅读 的 简易 性 。 计 算 机 界 著 名 学 者 尼古拉斯 。 沃 
思 (Wirth N. ) 提 出 的 “算法 十 数据 结构 二 程序 ”的 观点 正 说 明 数 据 结 构 的 重要 性 ,即使 在 面 
向 过 程 转向 面向 对 象 程序 设计 的 今天 ,对 象 中 底层 的 函数 实现 依然 能 体现 这 名 至 理 名 言 的 
正确 性 。 万 丈 高 楼 平地 起 ,楼 高 几何 看 地 基 。 数 据 结构 就 是 程序 设计 的 地 基 , 必 须 先 学 好 
它 , 以 打下 扎实 的 基础 。 

我 从 事 数据 结构 教学 已 有 三 十 多 年 ,教学 实践 中 深 深 体 会 到 ,数据 结构 "是 计算 机 专业 
一 门 很 难 的 课程 ,学 生 普遍 反映 过 于 抽象 和 难以 编程 实现 。 这 反映 了 几 个 现实 问题 : 四 高 
级 语言 课程 所 教授 的 内 容 与 数据 结构 编程 需求 有 一 定 的 距离 ,高 级 语言 教程 讨论 得 更 多 的 
是 数值 计算 方面 的 程序 设计 范例 ,对 于 离散 结构 的 讨论 相对 人 篇 少 。@”“ 算 法 设计 ?是 数据 结 
构 的 后 续 课程 ,很 多 设计 思想 在 “数据 结构 ?课程 中 暂时 无 法 起 到 引导 作用 。@ 从 数据 结构 
本 身 看 ,教材 书写 方式 有 时 成 了 学 习 过 程 的 阻碍 。 部 分 数据 结构 教材 偏重 理论 ,多 用 所 谓 的 
算法 表述 数据 结构 程序 设计 思想 ,导致 学 生 可 以 模仿 编程 的 范例 不 够 ,实际 效果 不 大 理想 ; 
部 分 教材 源 于 翻译 国外 教材 ,术语 和 描述 生 涩 难 懂 ; 部 分 教材 重点 、 难 点 不 突出 ,整体 结构 
不 完整 ,缺乏 应 用 层面 的 案例 分 析 , 增 加 了 学 生 的 学 习 困难 。 

2015 年 ,我 在 清华 大 学 出 版 社 作为 主编 出 版 了 《用 C 实现 数据 结构 程序 设计 》, 收 到 了 
来 自 全 国 各 地 的 大 学 生 或 程序 开发 工作 者 的 来 信 。 因 为 阅读 了 我 编写 的 教材 ,他 们 能 够 以 
较 快 的 速度 学 习 到 数据 结构 的 程序 设计 ,效果 很 理想 ,对 考研 也 有 较 大 帮助 ,希望 我 能 推出 
更 多 平台 上 的 数据 结构 源码 设计 。 受 到 这 些 热 情 读者 和 编辑 的 鼓励 ,我 开始 着 手 编写 数据 
结构 的 C++ 版 程序 设计 ,最 终 完 成 这 本 教材 ,希望 能 帮助 读者 尽快 学 会 数据 结构 程序 设计 。 

学 习 数 据 结构 是 一 种 “ 痛 并 快乐 着 ”的 过 程 ,在 学 习 的 时 候 大 部 分 学 生 都 会 感到 过 于 抽 
象 和 高 深 ,但 是 如 果 能 用 程序 具体 实现 ,就 会 有 成 就 感 ,会 被 计算 机 科学 家 的 奇 思 妙 想 所 宕 
撼 ,体会 到 程序 设计 的 引人入胜 ,整个 过 程 是 充满 挑战 和 乐趣 的 。 

本 书 特色 是 全 面 给 出 数据 结构 相关 程序 设计 源码 ,并 给 出 了 运行 界面 图 ,使 得 学 生 有 一 
个 可 以 研究 探讨、 模仿 、 提 高 的 平台 。 本 书 的 程序 设计 范例 很 多 都 具有 可 移植 性 、 实 用 性 和 
趣味 性 ,覆盖 了 多 种 程序 设计 方法 和 界面 设计 风格 。 


” 用 C++ 实现 数据 结构 程序 设计 


全 书 体系 结构 完整 ,注重 原理 与 实践 结合 ,重点 和 难点 突出 ,为 学 生 搭 建 了 全 面 的 学 习 
和 研究 平台 ,其 目标 是 学 生 易于 学 习 \ 老 师 易于 组 织 教学 。 本 书 提 供 了 菜单 编制 、 多 种 数据 
提供 方式 、 多 种 输出 格式 、 程 序 反 复 运行 、 处 理 意 外 情况 、 颜 色 和 标题 栏 . 方 向 键 控制 等 源码 ， 
提供 了 多 种 界面 设计 的 范例 。 线 性 表 之 后 先 介绍 查找 和 排序 基础 部 分 ,体现 了 线性 表 的 使 
用 价值 ,而 进 阶 部 分 涉及 更 复杂 的 数据 结构 ,在 大 部 分 数据 结构 知识 学 习 完 成 之 后 再 分 别 
讲解 。 

全 书 共 分 12 章 , 内 容 涉及 学 习 数 据 结构 基础 和 递归 思想 ; 线性 数据 结构 、 非 线性 数据 
结构 ; 线性 表 、 栈 、 队列、 字符 串 、 二 维 数组 . 树 和 森林 、 二 又 树 、 图 ; 还 涉及 查找 、 排 序 等 基础 
应 用 。 为 拓展 数据 结构 知识 ,还 介绍 了 文件 的 基础 知识 。 

本 书 配 有 电子 教案 和 程序 源 代 码 , 便 于 老师 教学 和 学 生 使 用 。 采 用 C++ 语言 编程 实现 ， 
程序 均 在 VC++ 6.0 下 调试 并 运行 通过 。 

数据 结构 是 程序 开发 的 基础 ,是 进入 程序 设计 殿堂 的 敲门砖 。 本 书 是 我 多 年 来 勤 妃 敬 
业 、 认 真 教学 和 深入 思考 的 结晶 ,希望 读者 能 分 享 和 品味 学 习 的 乐趣 。 

我 要 感谢 我 的 父母 及 家 人 ,还 有 我 的 诸多 朋友 ,他们 的 鼓励 和 支持 让 我 不 能 忘怀 。 

我 要 感谢 我 多 年 前 在 清华 大 学 研习 人 工 智 能 ”研究 生 课 程 时 的 指导 老师 石 纯 一 教授 ， 
他 对 专业 的 精通 、 做 事 的 认真 以 及 平易 近 人 的 态度 让 我 一 生 都 受益 匪 浅 , 那 段 时 光 是 我 一 生 
的 珍贵 回忆 和 骄傲。 

本 书 能 够 顺利 出 版 ,得 益 于 清华 大 学 出 版 社 的 全 力 支持 和 帮助 ,责任 编辑 的 细致 审 稿 和 
建议 使 本 书 增色 不 少 ,在 此 深 表 谢 意 。 

由 于 能 力 所 限 及 时 间 紧 迪 , 书 中 难免 存在 疏漏 ,希望 读者 提出 宝贵 意见 和 建议 ,以 便 再 
版 时 改进 和 提高 。 


马 春 江 ”于 湖北 汽车 工业 学 院 计算 机 系 
2019 年 1 月 
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第 1 章 ”数据 结构 基础 


本 章 介绍 数据 结构 的 背景 和 基本 概念 ,为 数据 结构 相关 程序 设计 奠定 基础 。 讲 解 逻辑 
结构 分 类 、 存 储 结构 分 类 与 基本 操作 的 名 称 和 特点 ,讨论 算法 和 算法 效率 分 析 、 递 归 的 概念 
和 相关 范例 。 


1.1 面 式 思维 和 点 式 思维 


人 们 学 完 高 级 语言 程序 设计 之 后 ,通常 希望 能 尽快 展示 出 自己 的 程序 设计 能 力 , 开 发 出 
一 些 原创 的 软件 作品 ,但 却 发 现 经 常 在 程序 设计 一 开始 就 陷入 了 不 知 所 措 的 情形 ,发 现 自己 
好 像 根 本 不 会 编程 。 这 是 一 个 令 人 困惑 的 问题 。 

下 面 通过 问题 的 讨论 来 看 看 这 究竟 是 怎么 回 事 。 


0 
在 图 1-1 所 示 的 模拟 白板 上 有 一 批 数据 ,请 问 哪 ， | 
一 个 是 最 大 值 ? | © 
很 显然 ,读者 一 眼 就 可 以 看 出 最 大 值 是 86。 读 ， OF 
者 根据 什么 说 最 大 值 是 86? 观察 .判断 ,思考 过 程 是 GO () | 


什么 ? 能 否 书写 出 完整 的 思考 过 程 呢 ? ee 

很 明显 答案 是 不 同 的 ,或 者 根本 说 不 清楚 是 如 果 
思考 的 ,只 是 一 眼 就 看 出 来 而 已 。 为 什么 会 出 现 这 种 情况 呢 ? 

这 是 因为 人 类 有 了 思维 能 力 之 后 ,经 过 训练 有 了 大 小 比较 和 选择 能 力 。 人 的 双眼 观察 
世界 是 立体 的 ,观察 到 的 信息 以 图 像 的 方式 进入 大 脑 ,简化 这 种 模型 后 可 以 认为 已 经 是 平面 
关系 。 人 类 的 大 脑 开始 工作 ,此 时 相当 于 有 很 多 部 高 速 计算 机 在 同时 工作 ,一 瞬间 结果 已 经 
出 现 。 但 是 实际 上 ,从 开始 思考 到 说 出 结果 这 一 段 的 工作 过 程 是 无 法 精确 描述 的 。 

把 计算 机 能 够 做 的 所 有 工作 称 为 “计算 ”, 就 是 一 种 广义 的 计算 。 计 算 机 在 进行 各 种 计 
算 时 是 否 和 人 的 思维 方式 一 样 呢 ? 

人 类 还 没有 真正 了 解 人 的 大 脑 思维 模式 ,无 论 是 医学 家 、 生 物 学 家 ,还 是 心理 学 家 .哲学 
家 都 无 法 说 明 人 是 如 何 记忆 、 如 何 思考 的 。 但 是 人 却 提出 了 让 机 器 来 帮助 进行 计算 这 样 的 
设想 。 怎 样 才能 让 机 器 做 这 些 事 呢 ? 科学 家 给 出 了 一 种 思路 , 那 就 是 “模拟 "机 制 ,也 就 是 不 
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管 人 类 是 如 何 完成 这 些 工 作 的 ,只 要 机 器 最 后 做 出 来 的 结果 和 人 类 做 的 结果 一 样 就 可 以 了 。 
人 类 的 记忆 机 制 和 思考 机 制 虽然 还 不 能 完全 搞 清楚 ,但 可 以 想象 它 是 一 个 很 复杂 的 网 
络 结构 ,复杂 到 任何 一 个 信息 点 都 可 以 直接 激活 另外 一 个 信息 点 ,这 就 是 “联想 *, 也 可 以 失 
去 任何 联系 ,这 就 是 “忘记 ?。 在 这 个 复杂 的 网 络 中 ,所 有 信息 都 是 立体 的 ,完成 思考 和 记忆 
的 过 程 也 是 立体 的 ,同时 人 类 在 观察 现实 生活 中 的 事物 时 也 是 立体 的 ,这 些 立体 信息 一 瞬间 
同时 进入 大 脑 ,之 后 人 类 开始 立体 式 思 维 过 程 和 记忆 过 程 。 从 上 面 求 最 大 值 问题 来 看 ,眼睛 
把 所 有 数据 一 次 看 完 ,之 后 同期 进入 大 脑 ,开始 立体 式 网 状 思维 。 本 书 把 这 种 思维 方式 称 为 
“ 面 式 思维 方式 "( 指 的 是 多 面 组 成 的 网 状 结构 ) ,简称 * 面 式 思维 "。 
对 应 记忆 方面 ,计算 机 中 使 用 的 是 “存储 器 "; 对 应 思考 方面 ,计算 机 中 则 使 用 的 是 "中 
天 处 理 器 "(CPU) , 它 的 特点 是 在 某 个 时 刻 永远 只 能 处 理 当前 特定 * 一 个 "存储 单元 的 信息 。 
虽然 内 存 中 可 以 同时 存放 很 多 数据 ,但 是 中 央 处 理 器 实际 上 工作 在 具体 的 “点 "上 ,而 不 
是 线条 .平面 图 形 、 立 体 图 形 等 ,因此 把 计算 机 的 思维 方式 称 为 “点 式 思维 ”"。 编 各 就 是 把 * 面 
式 思维 "转化 为 “点 式 思维 "的 过 程 ,或 者 说 如 何 用 * 点 式 思维 "来 模拟 “而 式 思维 ”, 所 以 在 编 
程 中 对 任何 要 处 理 的 事物 就 不 能 再 用 人 类 的 一 般 思 维 方式 .而 应 该 习惯 去 用 计算 机 的 思维 
方式 。 
针对 求 最 大 值 问题 ,为 了 达成 "点 式 思 维 ”, 就 必须 先 把 所 有 数据 排 成 一 行 (或 一 列 ), 然 
后 确定 求 最 大 值 的 规则 ,其 思路 为 : 首先 默认 "第 一 个 数据 "就 是 最 大 值 . 然 后 把 后 而 的 数据 
“逐一 "和 当前 最 大 值 进行 比较 ,如 果 有 比 当前 最 大 值 更 大 的 , 则 记录 该 位 置 , 设 其 为 最 大 值 
ee 继续 比较 过 程 ,直到 比 完 * 最 后 一 个 数据 ”, 就 求 出 了 最 
:@) 的 的 的 的 | 大 从 的 位 置 。 图 12 为 重新 排 区 后 的 图 1 1 中 的 数据 
在 上 述 讨论 中 必 第 一 个 "逐一 “最 后 一 个 "等 字眼 就 
是 点 式 思维 最 明确 的 象征 ,而 在 图 1-1 中 ,这 些 概念 都 

是 无 法 体现 的 。 

这 里 的 “一行 "实际 上 就 是 后 面 将 要 介绍 的 数据 结构 “线性 表 ”, 而 算法 的 名 称 可 以 归纳 
为 “顺序 比较 与 刷新 法 求 最 大 值 ”。 

了 解 "点 式 思维 "的 基本 特点 后 ,程序 设计 的 很 多 思路 者 将 变 得 相对 简单 ,在 数据 结构 的 
程序 设计 中 更 是 处 处 体现 "点 式 思维 * 的 影响 。 


1.2 数据 结构 背景 


计算 机 发 展 初期 ,人 们 主要 使 用 计算 机 处 理 数 值 计算 问题 ,如 天 气 预报 .军事 领域 ,大 型 

工程 等 计算 量 大 的 工作 。 解 决 这 样 一 个 具体 问题 需要 经 过 几 个 步骤 : 首先 从 具体 问题 抽象 

一 个 数学 模型 ,然后 设计 或 选择 一 个 求解 此 数学 模型 的 算法 ,最 后 编写 程序 .进行 调试 , 直 
至 得 到 最 终 的 结果 。 

随 着 计算 机 理论 和 技术 的 发 展 ,计算 机 的 主要 用 途 从 数值 计算 转 到 非 数值 计算 ,也 就 是 
数据 处 理 。 解 决 这 类 问题 的 关键 不 再 是 数学 分 析 和 计算 方法 ,而 是 要 设计 出 合适 的 数据 结 
构 。 这 类 非 数值 计算 问题 的 数学 模型 不 再 是 数学 方程 ,而 是 诸如 表 , 树 、 图 之 类 的 数据 结构 。 
“数据 结构 ”课程 主要 研究 非 数值 计算 的 程序 设计 问题 中 所 出 现 的 计算 机 操作 对 象 以 及 它们 
之 间 的 关系 和 操作 。 
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1968 年 美国 的 唐纳德 。 克 努 特 (Knuth D. E. ) 教 授 开 创 了 数据 结构 的 最 初 体系 ,他 编 
著 的 《计算 机 程序 设计 艺术 》(The Art of Computer Programming ) 第 一 卷 (基本 算法 》 是 第 
一 本 较 系 统 地 阐述 数据 逻辑 结构 和 存储 结构 及 其 操作 的 著作 ,此 获得 了 1974 年 图 灵 奖 。 

数据 结构 发 展 史上 还 有 一 位 不 能 不 提 的 巨匠 一 一 Pascal 语言 的 开发 者 尼古拉斯 ， 沃 
思 。 他 撰写 的 (算法 十 数据 结构 = 程序 》(Algorithms 十 Data Structures 二 Programs) 是 具有 里 
程 碑 意 义 的 优秀 书籍 之 一 。 他 是 结构 化 程序 设计 的 首创 者 ,也 是 1984 年 图 灵 奖 的 获得 者 。 

计算 机 科学 是 一 门 研究 数据 表示 和 数据 处 理 的 科学 。 数 据 是 计算 机 化 的 信息 , 它 是 计 
算 机 可 以 直接 处 理 的 最 基本 和 最 重要 的 对 象 。 在 科学 计算 数据 处 理 、. 过 程控 制 以 及 对 文件 
的 存储 、 检 索 和 数据 库 技术 等 计算 机 应 用 领域 中 ,都 有 对 数据 进行 处 理 的 过 程 。 因 此 ,要 设 
计 出 一 个 结构 良好 、 效 率 很 高 的 程序 ,必须 研究 数据 的 特性 、 数 据 间 的 相互 关系 及 其 对 应 的 
存储 表示 ,并 利用 这 些 特性 和 关系 设计 出 相应 的 算法 ,进一步 编 出 程序 。 

学 习 数 据 结构 的 目的 是 为 了 了 解 计算 机 处 理 对 象 的 特性 ,将 实际 问题 涉及 的 处 理 对 象 
在 计算 机 中 表示 出 来 ,并 对 它们 进行 处 理 。 与 此 同时 ,通过 算法 训练 来 提高 逻辑 思维 能 力 ， 
通过 程序 设计 技能 训练 来 促进 综合 应 用 能 力 和 专业 素质 的 提高 。 

程序 设计 的 基本 理论 涉及 三 门 重要 的 基础 课 : 高 级 语言 程序 设计 、 数 据 结构 、 算 法 设计 
与 分 析 。 高 级 语言 程序 设计 主要 是 解决 上 机 编程 的 环境 、 语 法 要 求 和 一 些 基 本 的 程序 设计 
技巧 ; 数据 结构 主要 是 把 数据 的 关系 研究 清楚 并 且 确 定 其 存储 方案 ,以 及 基本 操作 的 编程 
实现 ; 算法 设计 与 分 析 主 要 是 深入 研究 算法 的 设计 技术 和 时 间 、 空 间 效率 分 析 。 这 三 者 缺 
一 不 可 。 在 算法 设计 与 分 析 中 会 重点 讨论 时 间 效 率 分 析 , 故 本 书 中 没有 将 时 间 复 杂 度 的 计 
算 过 程 与 深入 分 析 作为 重点 , 仅 通过 一 些 简洁 分 析 确 定 其 结论 。 

“数据 结构 ”课程 主要 讨论 软件 开发 过 程 中 的 设计 阶段 ,同时 涉及 编码 和 分 析 阶 段 的 若 
干 基本 问题 也 会 被 综合 讨论 。 此 外 ,为 了 构造 出 好 的 数据 结构 并 实现 ,还 需 考虑 数据 结构 及 
其 实现 的 评价 与 选择 。 因 此 ,数据 结构 的 研究 内 容 包 括 3 个 层次 ,5 个 要 素 , 见 表 1-1。 


表 1-1 数据 结构 研究 的 主要 内 容 


层 次 数据 表示 数据 处 理 
抽象 层 逻辑 结构 基本 操作 
实现 层 存储 结构 算法 
评价 层 各 种 存储 结构 的 比较 及 算法 分 析 


1.3 数据 结构 的 应 用 案例 


在 学 习 程序 设计 的 过 程 中 ,必须 体会 到 “量变 引起 质变 ”的 重要 性 。 当 面临 的 任务 或 软 
件 系统 足够 复杂 时 ,很 多 无 足 轻 重 的 “小 事 ” 都 会 演变 成 “大 事 ”, 那 么 整体 设计 就 成 为 首要 的 
工作 。 在 使 用 高 级 语言 编程 时 如 果 不 进行 整体 设计 ,而 是 边 想 边 做 ,也 不 按照 开发 规范 书 
写 ,一 旦 该 开发 任务 涉及 的 数据 之 间 的 关系 比较 复杂 ,就 可 能 出 现 多 次 返工 或 开发 彻底 失败 
的 结局 ,所 以 在 软件 开发 前 必须 先 考虑 好 各 种 情况 ,尤其 是 数据 的 关系 ( 即 数 据 结构 ) 的 
设计 。 
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【应 用 案例 1-1】 人 机 对 弈 (如 下 棋 等 ) 程 序 设计 。 有 些 读者 喜欢 计算 机 可 能 是 因为 利 
用 计算 机 可 以 玩 游戏 ,而 作为 专业 工作 者 需要 更 深层 面 的 思考 ,如 各 种 横 类 的 对 弈 是 如 何 编 
程 实现 的 。 首 先是 界面 的 实现 ,如 棋盘 和 棋子 如 何 实现 ,显然 不 能 是 简单 的 图 片 , 因 为 还 要 
考虑 棋子 的 移动 。 另 外 要 对 弈 的 话 ,计算 机 怎么 知道 哪些 位 置 可 以 落 子 ,对 方 的 哪些 棋子 已 
经 被 吃 掉 ,而 我 方 的 哪些 棋子 已 经 受到 威胁 ,又 如 何 进一步 决策 进攻 或 防守 呢 ……。 通 过 这 
个 案例 可 以 认识 到 ,不 论 是 界面 还 是 功能 都 会 涉及 数据 结构 的 大 量 知识 ,如 果 没有 数据 结构 
很 难 编 出 游戏 或 更 复杂 的 软件 。 

【应 用 案例 1-2】 计算 机 计算 表达 式 。 计 算 机 能 计算 表达 式 ,似乎 天 经 地 义 ,否则 为 什 
么 叫 计算 机 呢 ? 但 当初 科学 家 实现 这 个 功能 时 却 很 困难 。 表 达 式 是 2 十 1, 计 算 机 能 开始 计 
算 吗 ? 不 行 ,因为 可 能 是 2 十 11, 所 以 必须 往 后 读 到 回 车 或 者 另外 一 个 运算 符 , 但 是 过 到 运算 
符 还 是 不 能 开始 计算 ,因为 可 能 是 2+11X3。 根 据 运算 规则 ,必须 先 计算 11X3, 可 是 表达 式 
又 可 能 是 2 十 11X3* ,那么 能 不 能 先 算 平方 呢 ? 也 不 能 ,因为 原来 的 表达 式 可 能 是 2 十 11 x 
32+ ,既然 有 括号 ,而 括号 中 又 出 现 了 加 法 ,那么 最 初 的 问题 就 会 重新 出 现 ,如 2 十 11 x 
3e+09 。 即 使 中 间 部 分 计算 结果 能 先 求 出 来 ,还 是 有 次 序 问题 ,如 原 式 为 2 二 11 X 3®71*? 
一 6 ,那么 现在 该 退回 去 做 加 法 ,还 是 往 前 走 去 做 减法 呢 ? 已 经 读 完 的 数据 和 运算 符 如 何 存 
储 ? 后 面 暂时 没有 读 到 的 数据 又 如 何 存储 ?如 果 这 些 数值 全 部 用 一 些 变量 存储 ,那么 启用 
多 少 个 变量 ? 变量 之 间 的 关系 如 何 管理 ? 这 些 问题 如 果 不 能 解决 , 想 让 计算 机 进行 “计算 ” 
完全 不 可 能 。 幸 运 的 是 科学 家 们 已 经 解决 了 这 些 问题 ,使 用 计算 机 能 够 做 到 数值 计算 的 精 
确 化 和 高 速 化 ,火箭 、 宇 害 飞船 等 涉及 大 量 计算 也 就 有 了 保证 。 本 范例 说 明 计算 机 要 实现 的 
很 多 功能 仅仅 靠 编 程 技巧 很 难 解决 ,必须 依赖 数据 结构 的 支撑 。 

【应 用 案例 1-3】 痕迹 检测 .DNA 检测 .文字 识别 、 人 像 识别 等 技术 的 实现 前 提 。 现 代 
科技 带 来 了 很 多 前 人 闻所未闻 、 想 也 想不到 的 科技 成 果 , 如 公安 系统 能 够 使 用 指纹 或 血液 等 
信息 追查 罪犯 ,医院 能 够 用 DNA 做 亲子 鉴定 ,计算 机 可 以 进行 文字 或 语音 识别 等 。 这 些 技 
术 面临 着 一 个 共同 的 难题 , 那 就 是 必须 存储 超大 量 的 数据 ,还 要 进一步 进行 快速 和 有 效 查 
找 。 有 时 数据 总 量 远 远 超 过 想象 ,被 称 为 海量 数据 。 那 么 海量 数据 如 何 存储 ,数据 之 间 的 关 
系 又 如 何 管理 ,进一步 又 如 何 实现 快速 查找 等 功能 呢 ? 这 个 范例 说 明 数 据 结 构 对 数据 的 组 
织 和 查找 技术 将 起 到 关键 的 作用 。 


1.4 数据 结构 基本 概念 


数据 结构 基本 结构 如 下 。 

数据 (Data) 。 一 般 人 们 谈 及 数据 就 会 想到 0 一 9 组 成 的 数字 ,实际 上 这 些 应 称 为 数值 。 
在 现实 生活 中 的 “信息 ”这 个 概念 一 旦 被 计算 机 存储 ,就 成 为 所 谓 的 “数据 "。 要 注意 的 是 ， 
“数据 ?并 不 能 完全 覆盖 “信息 ,比如 日 常生 活 中 的 “眉目 传情 ” ,情感 是 一 种 信息 但 是 并 不 能 
被 目前 的 计算 机 识别 ,存储 从 而 处 理 .所 以 数据 是 信息 的 一 种 载体 , 它 能 够 被 计算 机 识别 、 存 
储 和 加 工 处 理 。 

计算 机 科学 中 ,数据 可 以 是 数值 数据 ,也 可 以 是 非 数值 数据 。 数 值 数 据 是 一 些 整数 、 实 
数 或 复数 ,主要 用 于 工程 计算 、 科 学 计算 和 商务 处 理 等 ; 非 数值 数据 包括 字符 文字 、 图 形 、 
图 像 .语音 等 ,其 中 的 文字 又 包括 英文 .中 国 的 汉文 和 少数 民族 的 文字 、 其 他 各 国文 字 等 。 
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数据 元 素 (Data Element) 。 数 据 元 素 是 数据 的 基本 单位 。 在 不 同 场合 ,可 把 数据 元 素 
称 为 元 素 、 结 点 、 顶 点 .记录 等 。 

数据 项 (Data Item) 。 有 时 一 个 数据 元 素 还 可 以 由 若干 数据 项 组 成 。 例 如 ,人 员 信 息 的 
每 一 个 数据 元 素 就 是 一 个 人 的 记录 ,可 能 包括 编号 、 姓 名、 性 别 .籍贯 .出 生日 期 .电话 .手机 、 
通信 地 址 .电子 邮件 地 址 等 数据 项 。 这 些 数据 项 又 被 分 为 两 种 : 一 种 称 为 基本 项 ,如 性 别 、 
籍贯 等 ,这 些 数据 项 在 数据 处 理 时 不 再 分 割 ; 另 一 种 称 为 组 合 项 ,如 出 生日 期 可 以 分 为 年 、 
月 .日 等 更 小 的 项 。 

数据 对 象 (Data Object) 。 数 据 对 象 也 可 以 称 作 数据 元 素 类 (Data Element Class) ,是 具 
有 相同 性 质 的 数据 元 素 的 集合 。 在 某 些 具体 问题 中 ,数据 元 素 具有 相同 的 性 质 , 属 于 同一 数 
据 对 象 , 即 数据 元 素 是 数据 对 象 的 一 个 实例 。 

数据 结构 (Data Structure) 。 数 据 结 构 是 指 互相 之 间 存 在 一 种 或 多 种 关系 的 数据 元 素 
的 集合 。 在 使 用 计算 机 处 理 任何 问题 时 ,我 们 不 仅 关注 数据 本 身 , 也 一 定 会 关注 数据 元 
素 之 间 的 关系 ,因为 这 些 “ 关 系 ” 就 是 我 们 需要 的 “信息 ”, 这 种 数据 元 素 之 间 的 关系 就 是 

数据 结构 的 形式 定义 。 数 据 结 构 是 一 个 二 元 组 

Data_Structure = (D,R) 

其 中 ,D(Data 的 首 字 母 ) 是 数据 元 素 的 有 限 集 ; R(Relation 的 首 字母 ) 是 D 上 关系 的 有 
限 集 。 

数据 的 逻辑 结构 。 数 据 的 逻辑 结构 可 以 看 作 是 从 具体 问题 抽象 出 来 的 数学 模型 ,是 数 
据 本 身 的 关系 , 它 与 数据 的 存储 并 无 关系 ,有 点 像 纸 上 谈 兵 。 但 是 研究 数据 结构 的 目的 就 是 
为 了 在 计算 机 中 实现 对 它们 的 存储 并 进行 其 他 操作 ,为 此 还 需要 研究 如 何在 计算 机 中 存储 
逻辑 结构 。 

数据 的 存储 结构 。 计 算 机 中 的 存储 方法 就 是 “存储 结构 ", 有 时 也 称 为 数据 的 物理 结构 。 
它 主 要 研究 逻辑 结构 在 计算 机 中 的 实现 方法 ,包括 元 素 的 表示 和 元 素 之 间 关 系 的 表示 。 所 
以 对 数据 结构 可 以 理解 为 两 个 层面 , 即 逻 辑 结构 和 存储 结构 。 


1.5 逻辑 结构 分 类 


根据 数据 元 素 之 间 可 能 存在 的 关系 ,逻辑 结构 可 分 为 以 下 4 种 基本 结构 : 线性 结构 、 树 
状 结构 .图形 结构 和 集合 结构 。 

(1) 线性 结构 。 该 结构 的 数据 元 素 之 间 ( 从 一 个 方向 而 言 ) 只 有 一 维 的 关系 , 即 线性 关 
系 , 也 称 为 “一 对 一 ”关系 。 

(2) 树 状 结构 。 该 结构 的 数据 元 素 之 间 存 在 分 支 的 关系 ,也 称 为 “一 对 多 ”关系 。 可 以 
从 一 个 军队 的 组 成 体系 来 理解 : 一 个 团 有 多 个 营 , 一 个 营 有 多 个 连 ,一 个 连 有 多 个 班 ,一 个 
班 有 多 名 战士 等 。 

(3) 图 形 结构 。 该 结构 的 数据 元 素 之 间 可 以 有 任意 的 关系 ,也 称 为 “多 对 多 ”关系 ,图 形 
结构 有 时 也 称 作 网 状 结构 。 可 以 从 城市 的 交通 来 理解 ,从 一 个 地 点 到 另外 一 个 地 点 可 能 存 
在 很 多 路 径 , 也 可 能 绕 了 一 圈 , 又 回 到 原 地 。 

(4) 集合 结构 。 该 结构 内 部 的 数据 关系 很 松散 。 集 合 结构 主要 强调 元 素 的 “整体 性 ”和 
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元 素 的 “存在 性 ” ,数据 元 素 之 间 的 关系 基本 和 忽略。 离散 数学 课程 中 集合 关注 的 是 “ 某 个 元 素 
是 否 存在 于 某 个 集合 中 ”, 而 对 应 于 程序 设计 ,这 实际 上 就 是 查找 功能 。 本 书 第 3 章 会 指出 
这 种 结构 也 很 重要 ,通过 特殊 的 算法 思想 可 以 使 得 查找 操作 达到 很 快 的 速度 。 如 在 高 级 语 
言 编译 系统 中 ,判断 程序 设计 者 使 用 了 哪些 变量 ,以 及 哪些 是 定义 过 的 ,哪些 是 没有 定义 过 
的 ,为 检查 语法 错误 提供 信息 ,需要 在 尽 可 能 短 的 时 间 内 得 到 结果 。 

图 1-3 为 4 种 逻辑 结构 的 示意 图 。 


QO 
o> Ye 
OO QO XT 0 
© oo (LO: 

(a) 线性 结构 (b) 树 状 结构 (9 图 形 结构 (d) 集合 结构 


1-3 4 种 逻辑 结构 的 示意 图 


1.6 存储 结构 分 类 


数据 结构 主要 讨论 数据 的 关系 以 及 存储 其 关系 的 具体 实现 ,任何 一 种 数据 结构 都 将 通 
过 存储 结构 来 体现 在 计算 机 中 是 如 何 处 理 的 ,此 时 就 必然 涉及 “地 址 "等 概念 。 

存储 地 址 就 是 一 个 存储 单元 的 编号 ,通常 可 以 认为 从 1 开始 ,这 样 比较 容易 理解 ,但 是 
高 级 语言 的 数组 大 多 从 0 开始 ,更 实用 和 更 通用 的 还 有 其 他 进 制 ,在 程序 设计 中 还 可 以 降序 
使 用 。 图 1-4 为 各 种 存储 单元 地 址 编号 对 比 示 意图 。 


简单 地 址 编号 1 人 3 4 5 6 7 8 9 10 
数组 下 标 地 址 ”0 1 2 3 4 5 6 尝 8 9 
- 进 制 地 址 0000 0001 0010 0011 0100 0101 0110 0111 1000 1001 


十 六 进 制 地 址 0116 0117 0118 0119 OllA OllB olIC ollD ollE OUIF 
十进制 升序 地 址 1024 1025 1026 1027 1028 1029 1030 1031 1032 1033 
十 进 制 降序 地 址 1000 0999 0998 0997 0996 0995 0994 0993 0992 0991 


图 1-4 各 种 存储 单元 地 址 编号 对 比 示 意图 


常用 的 数据 存储 结构 有 4 种 : 顺序 存储 、 链 接 存储 、 索 引 存储 和 哈 希 存储 。 

(1) 顺序 存储 。 顺 序 存 储 方法 是 启用 一 批 物 理 位置 相 邻 的 存储 单元 ,然后 将 逻辑 上 相 
邻 的 元 素 依次 存储 在 其 中 。 顺 序 存储 结构 是 一 种 最 基本 的 存储 表示 方法 ,通常 借助 高 级 请 
言 中 的 数组 机 制 实现 。 

(2) 链接 存储 。 借 助 高 级 语言 中 的 指针 机 制 可 以 实现 链表 ,这 种 链接 存储 方法 对 逻辑 
上 相 邻 的 元 素 不 要 求 其 物理 位 置 相 邻 元素 间 的 逻辑 关系 通过 指针 来 管理 。 

(3) 索引 存储 。 这 种 存储 方案 的 思路 是 在 被 处 理 的 正常 数据 之 外 ,增加 一 批 管 理 数据 
来 提高 查找 效率 ,其 原理 类 似 书籍 的 目录 和 内 容 。 

(4) 哈 希 存储 (也 称 为 散 列 存储 ) 。 这 是 一 种 特殊 的 存储 方案 ,主要 用 来 提高 查找 效率 。 
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图 1-5 为 顺序 存储 和 链接 存储 示意 图 。 
lk WE :NE 
dataarray x1 | | 四 国 国 headp 四 Hz| HH3| | 和 | 
(a) 顺序 存储 (b) 链接 存储 
1-5 顺序 存储 和 链接 存储 示意 图 


对 于 某 种 逻辑 结构 ,这 4 种 存储 结构 并 不 一 定 都 会 采用 。 作 为 基本 的 存储 方法 ,大 多 数 
逻辑 结构 会 讨论 用 顺序 存储 和 链接 存储 如 何 实现 ,而 索引 存储 和 哈 希 存储 只 有 在 特殊 的 情 
况 下 才 会 采用 。 

存储 器 一 般 分 为 外 存 和 内 存 。 外 存 的 特点 是 存储 容量 大 ,价格 相对 低 , 读 写 速度 慢 , 数 
据 可 以 永久 性 保存 ; 内 存 一 般 价格 相对 高 ,所 以 计算 机 配备 的 内 存 容量 相 比 外 存 都 小 得 多 ， 
内 存 读 写 速度 相当 快 ,但 是 在 断 电 的 情况 下 ,信息 会 全 部 丢失 。 顺 序 存 储 用 到 的 数组 以 及 链 
接 存 储 使 用 的 链表 都 是 内 存 中 的 存储 方法 。 


1.7 数据 结构 基本 操作 


处 理 数据 并 不 仅仅 是 为 了 把 数据 存 人 计算 机 ,最 终 目的 是 要 使 用 数据 ,必须 通过 各 种 方 
式 来 对 其 中 的 某 些 数据 或 整个 结构 进行 处 理 , 通 常 把 这 种 处 理 称 为 “操作 ?或 “运算 ”。 真 实 
的 某 个 系统 中 对 于 数据 的 “操作 ?可 能 是 非常 多 的 ,比如 通过 菜单 可 以 看 到 常用 的 文字 处 理 
软件 Word 的 功能 就 很 强大 。 

以 下 最 基本 的 操作 构成 了 所 有 复杂 操作 的 基础 ,通过 * 搭 积木 ? 式 的 方法 可 以 演变 出 更 
复杂 的 操作 。 

基本 操作 有 初始 化 数据 结构 .销毁 数据 结构 . 读 取 一 个 数据 查找 一 个 数据 .遍历 所 有 数 
据 、 插 入 一 个 数据 删除 一 个 数据 .判断 数据 结构 是 否 为 空 , 判 断 数据 结构 是 否 为 满 ,将 数据 
进行 排序 等 。 

上 述 操作 被 分 成 两 大 类 : 静态 操作 和 动态 操作 。 静 态 操 作 指 的 是 操作 完成 后 对 于 原来 
的 数据 或 信息 量 没有 产生 任何 变化 性 的 影响 ; 动态 操作 指 的 是 经 过 操作 后 ,或 者 数据 发 生 
了 变化 ,或 者 信息 量 发 生 了 变化 。 进 行 这 样 的 分 类 是 因为 动态 操作 有 一 定 的 危险 性 ,可 能 会 
带 来 副作用 ,编程 时 一 定 要 小 心 并 且 最 好 提供 回 退 机 制 。 如 在 使 用 某 些 软件 中 , 想 要 进行 动 
态 操作 ,会 弹出 提示 窗口 ,询问 是 否 确定 ,如 果 确 定 就 继续 ,否则 就 返回 。 静 态 操作 则 可 以 进 
行 任意 多 次 。 

(1) 初始 化 数据 结构 。 数 据 结构 从 无 到 有 被 建立 的 过 程 称 为 初始 化 数据 结构 ,虽然 此 
时 其 中 没有 数据 ,但 是 结构 已 经 存在 。 另 外 也 可 以 是 原本 有 数据 ,根据 某 种 情况 要 求 清空 后 
回 到 初始 状态 。 

(2) 销毁 数据 结构 。 和 上 面 的 操作 正好 相反 , 它 将 一 个 结构 彻底 删除 。 注 意 ,可 能 会 有 
一 些 附加 的 工作 ,如 向 操作 系统 申请 了 存储 单元 , 则 要 进行 释放 ,以 免 造 成 “内 存 垃圾 ”。 

(3) 读 取 一 个 数据 。 从 一 个 特定 的 位 置 读 取 一 个 数据 以 供 使 用 。 

(4) 查找 一 个 数据 。 目 标 是 寻找 一 个 数据 是 否 存在 于 该 数据 结构 中 。 

(5) 遍历 所 有 数据 。 这 是 一 个 重要 操作 , 它 应 该 是 每 种 数据 结构 ( 除 个 别 特殊 的 ) 的 基 
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本 操作 。 它 被 定义 为 使 用 某 种 有 规律 的 方法 访问 某 种 数据 结构 中 的 所 有 数据 至 少 一 次 且 至 
多 一 次 ( 既 没 有 重复 ,也 没有 遗漏 )。 例 如 ,一 个 公司 在 新 的 一 年 开始 时 要 给 所 有 员工 都 增加 
100 元 工资 ,这 个 操作 就 是 遍历 ,因为 不 应 该 漏 掉 某 人 ,也 不 应 该 有 人 重复 获得 。 

(6) 插入 一 个 数据 。 即 新 增加 一 个 数据 ,此 操作 可 能 会 因为 某 些 数据 结构 的 约定 而 只 
能 在 特殊 位 置 进行 。 

(7) 删除 一 个 数据 。 要 注意 这 是 一 个 典型 的 动态 操作 ,有 一 定 的 危险 和 副作用 ,编程 时 
一 定 要 给 出 提示 信息 ,最 好 提供 回 退 机 制 。 

(8) 判断 数据 结构 是 否 为 空 。 主 要 指 相应 的 数据 结构 中 是 否 已 经 没有 任何 数据 ,这 个 
操作 也 很 重要 ,在 很 多 应 用 中 用 来 作为 程序 结束 条 件 之 一 。 

(9) 判断 数据 结构 是 否 为 满 。 主 要 指 相应 的 空间 是 否 使 用 完毕 ,这 个 操作 和 存储 结构 有 关 。 

(10) 将 数据 进行 排序 。 对 于 线性 关系 的 数据 ,从 大 到 小 或 从 小 到 大 进行 重新 排列 。 

了 解 了 数据 结构 的 基本 操作 后 ,可 以 设想 某 些 操作 是 通过 基本 操作 来 组 合 完成 的 。 例 
如 合并 两 个 数据 结构 ,可 以 认为 是 通过 把 第 二 个 数据 结构 中 的 数据 逐个 插入 到 第 一 个 数据 
结构 中 来 完成 ; 再 如 删除 多 个 数据 ,可 以 理解 为 进行 多 次 删除 ,每 次 删除 一 个 数据 。 


1.8 算法 和 算法 效率 分 析 基础 


在 学 习 数据 结构 的 过 程 中 ,不 仅 要 关心 逻辑 结构 和 存储 结构 ,还 要 不 断 地 实现 各 种 基本 
操作 ,就 是 编程 。 把 主要 精力 放 在 解 题 的 思路 上 ,不 要 急于 写 出 完全 符合 语法 规范 的 程序 ， 
可 以 先 写 出 一 个 框架 ,这 个 框架 被 称 为 “算法 ”。 

算法 (Algorithm) 就 是 解决 问题 的 思路 和 方法 , 它 是 对 问题 求解 的 多 个 步骤 进行 描述 的 
有 限 序列 。 其 中 每 个 步骤 表示 一 个 或 多 个 操作 。 

算法 的 特性 如 下 。 

(1) 有 穷 性 。 一 个 算法 必须 在 有 穷 步骤 之 后 结束 , 即 必须 在 有 限时 间 内 完成 。 这 也 是 
从 计算 机 的 角度 来 体现 的 。 

(2) 确定 性 。 算 法 的 每 个 步骤 必须 有 确切 的 定义 ,无 二 义 性 。 算 法 运行 相对 于 相同 的 
输入 仅 有 唯一 的 一 条 执行 路 径 。 

(3) 可 行 性 。 算 法 中 的 每 个 步骤 都 可 以 通过 计算 机 允许 的 .已 经 实现 的 基本 操作 的 有 
限 次 执行 得 以 实现 。 算 法 必须 基于 计算 机 目前 的 处 理 能 力 。 

(4) 输入 。 一 个 算法 具有 和 零 个 或 多 个 输入 ,这 些 输入 取 自 特定 的 数据 对 象 集合 。 可 以 
没有 输入 ,因为 有 些 数据 可 以 由 计算 机 自己 产生 ,如 象棋 的 棋盘 和 棋子 。 

(5) 输出 。 一 个 算法 具有 一 个 或 多 个 输出 .这 些 输出 同 输入 之 间 存 在 某 种 特定 的 关系 。 
至 少 有 一 个 输出 是 因为 我 们 的 应 用 需要 结果 。 输 出 的 形式 有 很 多 ,可 以 在 屏幕 上 显示 ,也 可 
以 通过 打印 机 打印 出 来 ; 可 以 是 语音 发 声 , 也 可 以 利用 互联 网 远程 传输 ; 还 可 以 控制 工厂 
中 的 某 个 设备 ,启动 一 个 新 的 动作 。 

算法 突出 思想 方法 ,程序 突出 语法 的 正确 性 ,二 者 既 有 联系 ,又 有 区 别 。 一 个 程序 不 一 
定 满足 有 穷 性 。 如 操作 系统 只 要 不 被 人 为 停止 或 出 现 故障 , 它 应 该 一 直 保 持 运行 状态 ,即使 
没有 任务 需要 处 理 , 它 仍 处 于 动态 等 竺 中。 程序 中 的 指令 必须 是 机 器 可 执行 的 ,而 算法 中 的 
指令 则 无 此 限制 。 算 法 代表 了 对 问题 的 求解 ,程序 则 是 算法 在 计算 机 上 的 实现 。 一 个 算法 
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若 用 程序 设计 语言 来 描述 , 则 它 就 是 一 个 程序 。 显 然 算 法 才 是 程序 的 灵魂 ,而 程序 只 不 过 是 
肉体 和 外 衣 。 

设计 一 个 好 算法 通常 要 考虑 以 下 要 求 : 

(1) 正确 性 。 算 法 的 执行 结果 应 当 满 足 预先 设计 的 功能 和 性 能 要 求 。 

(2) 可 读 性 。 一 个 算法 应 当 思 路 清晰 ,层次 分 明 ,简单 明了 , 易 读 易 懂 。 

(3) 健壮 性 。 当 输入 不 合法 数据 时 ,算法 应 能 进行 相关 处 理 , 不 至 于 引起 错误 后 果 。 

(4) 高 效 性 。 良 好 的 算法 应 该 能 有 效 使 用 存储 空间 并 有 和 较 高 的 时 间 效 率 。 

算法 与 数据 结构 的 关系 非常 紧密 ,所 以 在 算法 设计 之 前 要 先 确定 相应 的 数据 结构 ,而 在 
讨论 某 一 种 数据 结构 时 也 必然 会 涉及 相应 的 算法 。 一 般 主 要 从 算法 特性 、 算 法 描述 .算法 性 
能 分 析 与 度量 3 个 方面 对 算法 进行 讨论 。 

算法 与 数据 结构 是 相辅相成 的 。 解 决 某 一 特定 类 型 问题 的 算法 可 以 选择 不 同 的 数据 结 
构 ,选择 恰当 与 否 直接 影响 算法 的 效率 。 反 之 ,一 种 数据 结构 的 优 劣 由 各 种 算法 的 执行 情况 来 
体现 。 

算法 不 是 程序 ,可 以 使 用 各 种 不 同方 法 来 描述 。 最 简单 的 是 使 用 自然 语言 (如 中 文 、 英 
文 等 ) ,其 优点 是 简单 旦 便于 阅读 ,缺点 是 不 够 严谨 。 也 可 以 使 用 程序 流程 图 、 盒 图 .PAD 等 
软件 开发 描述 工具 ,其 特点 是 描述 过 程 简洁 、 明 了 ,但 是 绘制 工作 量 较 大 。 用 以 上 方法 描述 
的 算法 若 要 转换 成 可 执行 的 程序 还 有 一 个 编程 量 的 问题 。 还 可 以 直接 使 用 某 种 高 级 语言 的 
简化 版 本 (有 时 称 为 类 高 级 语言 ,如 like-Pascal \like-C like-C++ 等 ,书写 出 的 代码 称 为 伪 码 ) 
来 描述 算法 , 它 的 缺点 是 有 些 抽 象 ,常常 需要 注释 才能 明白 。 一 旦 需要 转化 为 程序 则 时 间 最 
短 , 已 有 一 些 工具 软件 帮助 转换 。 

通常 可 以 从 一 个 算法 的 时 间 复 杂 度 与 空间 复杂 度 来 评价 算法 的 优 劣 。 将 一 个 算法 转换 
成 程序 并 在 计算 机 上 执行 时 ,其 运行 所 需要 的 时 间 取 决 于 下 列 因 素 : 

(1) 硬件 的 速度 。 不 同 级 别 CPU 的 计算 机 在 速度 上 差别 很 大 。 

(2) 书写 程序 的 高 级 语言 。 通 常 汇编 语言 的 执行 速度 比 高 级 语言 快 。 

(3) 编译 程序 所 生成 目标 代码 的 质量 。 对 于 代码 优化 较 好 的 编译 系统 ,其 所 生成 的 程 
序 质量 也 较 高 。 

(4) 问题 的 规模 。 例 如 , 求 100X100 的 矩阵 相 乘 与 求 10 000X 10 000 的 矩阵 相 乘 的 执 
行 时 间 必 然 是 不 同 的 。 

显然 ,在 各 种 因素 都 不 能 确定 的 情况 下 很 难 比较 出 各 个 算法 的 执行 时 间 。 既 然 算法 本 
身 不 能 直接 运行 ,也 就 不 能 统计 其 绝对 时 间 来 衡量 算法 的 时 间 效 率 。 

假定 将 上 述 各 种 与 计算 机 相关 的 软 硬 件 因素 都 确定 下 来 ,这 时 一 个 算法 的 工作 量 就 只 
依赖 于 问题 的 规模 ,或 者 说 它 是 问题 规模 的 函数 ,通常 会 使 用 以 下 复杂 度 概 念 来 描述 它们 。 

(1) 时 间 复 杂 度 (Time Complexity) 。 一 个 算法 的 时 间 复 杂 度 是 指 算法 从 开始 到 结束 
所 需要 的 时 间 规 模 。 一 个 算法 是 由 控制 结构 和 基本 操作 构成 的 ,其 执行 时 间 取决 于 两 者 的 
综合 效果 。 为 了 便于 比较 同一 问题 的 不 同 的 算法 ,通常 的 做 法 是 从 算法 中 选取 一 种 基本 操 
作 , 以 该 基本 操作 重复 执行 的 次 数 作 为 算法 的 时 间 度 量 。 一 般 情况 下 ,算法 中 基本 操作 重复 
执行 的 次 数 是 规模 n 的 某 个 函数 T(n)。 但 是 许多 时 候 要 精确 地 计算 T(n) 是 很 困难 的 ,在 
此 引入 渐进 时 间 复 杂 度 ,在 数量 上 估计 一 个 算法 的 执行 时 间 ,也 能 够 达到 分 析 算 法 的 目的 。 

(2) 大 O 记 号 。 如 果 存 在 两 个 ( 正 ) 常 数 c 和 m ,使 得 对 所 有 的 n, 当 n 宇 m 时 ,f(n) 全 cg(n)， 


9> 


用 C++ 实现 数据 结构 程序 设计 


则 称 fn) 一 OCg(Cn))。 

(3) 渐进 时 间 复 杂 度 。 使 用 大 O 记号 表示 的 算法 时 间 复 杂 度 , 称 为 算法 的 渐进 时 间 复 
杂 度 (Asymptotic Complexity) ,简称 为 时 间 复 杂 度 。 

一 般 的 时 间 复 杂 度 从 低 到 高 逐 级 排列 为 : 

O(1) < O(Nogsn) < O(n) < Onlogsn) < O(n) < On’) < O02") 
(常数 级 对 数 级 平方 级 立方 级 指数 级 ) 

上 述 每 一 级 别 都 代表 一 次 质变 , 越 低 的 级 别 代 表 越 高 的 时 间 效 率 。 另 外 还 会 有 其 他 的 
时 间 复 杂 度 ,如 O(n 十 m)。 改 进 算法 的 目标 之 一 就 是 降低 时 间 复 杂 度 ,也 就 是 提高 时 间 效 
率 。 如 果 把 一 个 O(n) 的 算法 改进 成 O(logzn) 的 算法 ,就 是 很 大 的 进步 。 如 n= 二 10 000, 而 
log:ns*13 ,不 论 单位 是 小 时 ,还 是 分 钟 甚至 是 秒 ,都 是 巨大 的 进步 。 

如 果 有 一 个 语句 ,如 x 十 十 在 一 段 程序 源码 中 只 写 了 一 次 ,也 只 运行 了 一 次 ,那么 统计 
次 数 就 是 一 次 ,但 是 如 果 它 在 一 个 循环 体 中 ,而 这 个 循环 执行 了 mn 次 ,那么 这 个 语句 也 就 执 
行 了 n 次。 这 就 是 O(n) 级 时 间 复 杂 度 的 算法 。 如 果 这 个 语句 是 一 个 双重 循环 的 循环 体 , 而 
双重 循环 里 外 都 是 n 次 ,那么 一 共 是 n? 次 ,这 就 是 O(n ) 级 时 间 复 杂 度 的 算法 。 类 似 的 ， 
On’) 就 是 三 重 循环 的 体现 。 

Xt++ for(i=1;i<=n; i++) for(i=1;i<=n; i++) 

Xt++; for(j=1;i<=n; i++) 

0(1) O(n) oO(m) 

通常 用 O(1) 表 示 常 数 级 , 即 与 数据 量 或 操作 次 数 n 无 关 。 而 涉及 logsn 的 时 间 复 杂 
度 ,通常 都 和 后 面 要 介绍 到 的 二 叉 树 有 关 。 

要 特别 注意 指数 级 时 间 复 杂 度 , 因 其 代表 可 行 性 不 够 ,会 耗费 巨大 时 间 代 价 。2" 一 开 
始 增长 并 不 快 ,但 是 随 着 n 的 加 大 ,很 快 就 会 突飞猛进 , 远 远 超过 其 他 函数 。 要 努力 避免 此 
类 时 间 复 杂 度 的 程序 设计 。 

在 分 析 算 法 复杂 度 时 ,一 般 只 需 关注 最 大 的 时 间 规 模 , 会 忽略 掉 低级 的 时 间 复 杂 度 。 

例如 ,一 个 算法 TCn) 王 800m 十 450m 十 2000, 则 可 记 作 TCn) 一 OCnz) 。 

棋盘 奖励 问题 。 古 时 一 位 国王 酷爱 下 棋 , 于 是 重奖 天 下 发 明 棋 者 ,有 一 位 智者 发 明了 一 
种 类 似 国际 象棋 的 棋 。 国 王 玩 过 后 大 喜 过 望 , 要 重奖 这 位 智者 ,许诺 可 以 给 他 任何 东西 , 智 
者 说 :“ 其 他 的 我 都 不 要 ,我 只 要 大 米 。? 国 王 很 证 异 , 问 他 要 多 少 , 他 说 也 不 多 , 放 满 棋盘 就 
可 以 。 国 王 依 然 很 惊奇 , 那 能 有 多 少 ? 智者 说 :“ 我 的 棋盘 是 8X8 的 ,一 共 64 个 格子 。 第 
一 个 格子 里 只 放 一 粒 米 就 可 以 ,第 二 个 格子 里 放 2 粒 , 以 后 每 一 个 格子 都 是 上 一 个 格子 的 两 
倍 , 直 到 放 完 棋盘 上 所 有 格子 .” 国 王 觉得 这 是 一 件 很 小 的 事情 ,可 是 在 大 臣 们 计算 后 , 才 知 
道 即 使 把 地 球 表面 都 种 上 水 稻 也 不 够 ,这 就 是 0(2") 级 算法 复杂 度 的 案例 。 

空间 复杂 度 (Space Complexity)。 除 了 时 间 效 率 之 外 ,还 有 空间 利用 率 的 问题 。 一 个 
算法 的 空间 复杂 度 是 指 从 算法 开始 到 结束 所 需 的 存储 量 。 算 法 的 一 次 运行 是 针对 所 求解 的 
问题 的 某 一 特定 实例 而 言 的 。 如 排序 算法 的 每 次 执行 是 对 一 组 特定 个 数 的 数据 进行 排序 ， 
对 该 组 数据 的 排序 是 排序 问题 的 一 个 实例 。 数 据 个 数 可 视 为 该 实例 的 一 个 特征 。 

算法 运行 所 需 的 存储 空间 包括 以 下 两 部 分 : 

(1) 固定 部 分 。 这 部 分 空间 与 所 处 理 数据 的 个 数 并 无 关系 , 即 与 问题 实例 的 特征 无 关 。 
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它 包 括 程序 代码 常量 ,简单 变量 . 定 长 成 分 的 结构 变量 等 所 占 的 空间 量 。 

(2) 可 变 部 分 。 这 部 分 空间 大 小 与 算法 在 某 次 执行 中 处 理 的 特定 数据 的 规模 有 关 。 如 
1000 个 数据 元 素 的 排序 算法 与 100 000 个 数据 元 素 的 排序 算法 所 需 的 存储 空间 显然 是 不 
同 的 。 

时 间 复 杂 度 和 空间 复杂 度 在 一 定 程度 上 是 互 为 代价 的 , 即 如 果 要 提高 时 间 效 率 , 通 常会 
付出 一 些 空间 代价 。 基 于 存储 器 价格 的 大 幅 下 降 , 这 种 代价 是 值得 的 。 如 果 一 个 算法 被 改 
进 后 时 间 复 杂 度 和 空间 复杂 度 都 可 以 下 降 , 则 说 明 原 算法 本 身 的 设计 离 较 好 的 标准 还 相差 
较 远 。 随 着 存储 器 价格 的 下 降 , 人 们 一 般 较 少 关注 空间 利用 率 ,重点 是 提高 程序 的 执行 
速度 。 


1.9 递归 的 概念 和 应 用 


递归 (Recursion) 简 单 地 说 就 是 某 种 结构 自己 调用 自己 。 从 程序 设计 的 角度 看 ,递归 是 
指 包含 调用 该 函数 本 身 的 语句 。 除 了 顺序 、 分 支 和 循环 三 大 控制 结构 外 ,递归 也 是 一 种 重要 
的 程序 流程 控制 结构 。 
递归 技术 在 很 多 方面 可 以 体现 ,如 理解 问题 的 思路 、 定 义 数 学 概念 .定义 数据 结构 (逻辑 
结构 或 存储 结构 )、 解 决 疑难 问题 .具体 程序 设计 等 。 在 程序 设计 中 它 大 显 身手 ,是 解决 许多 
问题 的 重要 思路 之 一 。 
递归 的 表现 形式 可 能 并 不 一 定 是 调用 自身 , 如, system01 调用 了 system02, 而 
system02 又 调用 了 system01 ,那么 这 也 叫 递 归 。 另 外 在 递归 技术 中 有 可 能 调用 自身 不 止 一 
次 ,这 样 它 的 内 部 调用 关系 更 加 复杂 ,通过 直接 的 程序 流程 来 理解 不 大 容易 ,最 好 通过 对 原 
理 的 理解 去 体会 该 结构 的 实际 功能 。 
首先 介绍 用 递归 思想 计算 阶乘 ,在 中 学 的 数学 知识 中 ,阶乘 的 运算 为 一 个 连 乘积 , 即 
nl 二 nX(n 一 1)X(n 一 2)X(n 一 3)X(n 一 4)X…X3X2X1。 现 在 从 另外 一 个 角度 来 理 
解 阶乘 的 计算 方法 ,看 一 看 这 种 思维 方式 是 不 是 很 独特 。 把 上 面 的 计算 过 程 分 成 两 个 部 
分 ,第 一 部 分 为 第 一 个 字母 n, 第 二 部 分 为 除了 第 一 个 乘 号 后 面 的 所 有 内 容 ,这 样 计算 公 
式 就 可 以 写成 n1=nX (Cn 一 1)!。 这 个 公式 中 ,阶乘 的 定义 就 使 用 了 阶乘 的 符号 ,这 就 是 
递归 思想 的 体现 。 
递归 计算 公式 和 传统 计算 公式 相 比较 ,必须 附加 给 出 公式 的 结束 条 件 ,否则 这 个 计算 过 
程 就 没有 终结 了 。 
阶乘 的 计算 应 该 把 结束 点 定义 在 1 ,结束 条 件 就 是 1!=1。 
下 面 通过 模拟 4! 的 计算 过 程 ,可 以 理解 完整 的 递归 思想 。 
4!=4X31 
一 4X3X21! 
一 4X3X2Xl1! 
一 4X3X2X1 
一 4X3X2 
一 4X6 
一 24 
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从 右 到 左 分 步 计算 。 递归 的 执行 过 程 包 含 进入 和 回 退 两 个 环节 。 


在 计算 过 程 中 ,递归 进入 的 时 候 是 从 左 到 右 逐 级 展开 的 ,而 到 了 结束 点 之 后 开始 回 退 ， 


以 下 是 计算 阶乘 的 程序 源码 ,虽然 功能 简单 ,语句 数 也 非常 少 ,但 是 此 处 还 是 采用 了 
C++ 的 对 象 结构 ,主要 目的 是 为 了 复习 对 象 的 语法 规则 。 为 了 能 计算 更 大 数值 的 阶乘 和 保 
存 计算 结果 ,采用 了 长 整 型 数据 类 型 。 其 中 结束 点 设计 为 num 近 1, 是 为 了 避免 其 他 意外 数 
值 的 影响 。 


【程序 源码 1-1】 计算 阶乘 的 递归 函数 程序 设计 。 


/* 功 能 : 计算 阶乘 的 递归 函数 程序 设计 。 


为 了 能 计算 更 大 数值 的 阶乘 和 保存 计算 结果 ,采用 了 长 整 型 数据 类 型 。 


但 也 只 能 计算 到 12 的 阶乘 ， 


其 中 结束 点 设计 为 num<1, 这 是 为 了 避免 其 他 意外 数值 的 影响 。* / 


# include < iostream.h> 
# include < iomanip> 
# include < windows.h> 
class fact 
{ 
public: 
fact(); 
~fact(){}; 
long int factorial( long int num); 
void startcalcu(void); 
protected: 
long int num; 
}; 
fact: :fact() 
{} 
long int fact: :factorial (long int num) 
{ 
if(num<=1) 
return 1; 
else 
return(num * factorial( num 一 1 )); 
} 
void fact: :startcalcu(void) 
{ 
long int product; 
cout <<" 请 输入 小 于 或 等 于 12 的 一 个 整数 : "; 
cin>> num; 
if(num> 12) 
cout <<" 数 据 超 出 计算 范围 !!!"<< endl; 
else 
{ product = factorial(num); 
cout << num <<"!= "<< product << endl; 


void main(void) 


// 定 义 一 个 类 


// 递 归 终 止 条 件 @ 


// 递 归 调用 @ 
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system("color f0"); 
SetConsoleTitle(" 递 归 计 算 阶 乘 "); // 设 置 标题 
fact newnum; 
char choice; 
bool flag; 
flag=1; 
while (flag) 
{ 
system("cls"); 
cout <<" 计 算 阶 乘 的 函数 程序 :"<< endl; 
newnum. startcalcu( ) 
cout << endl <<" 如 果 不 再 计算 ,请 按 N, 否则 按 其 他 任意 键 继 续 计 算 ……"<< endl; 
choice = getchar(); 
if(choice == 'N'|| choice == 'n') 
flag= 0; 
} 
cout <<" 成 功 退 出 系统 .…... "<< endl; 
System("pause" ); 
exit(1); 
} 
在 这 个 程序 中 ,首先 复习 了 窗口 前 景 和 背景 色 修改 \ 设 置 标题 栏 信息 、 屏 幕 清 屏 、 反 复 运 
行 某 些 功能 段 ,标志 位 的 运用 .人 性 化 提示 和 交互 设计 、 清 空 输入 缓冲 区 ,键盘 响应 和 测试 特 
定 键 位 以 及 同时 处 理 大 小 写 .暂停 运行 ,结束 程序 运行 等 命令 。 
递归 算法 的 时 间 效 率 分 析 不 能 简单 地 按照 表面 请 句 数量 进行 ,而 是 要 根据 递归 的 特点 写 
出 算法 复杂 度 的 递归 公式 。 设 TCn) 为 原 算 法 的 时 间 复 杂 度 ,四 的 时 间 效 率 为 0(1) ,但 是 @ 的 
时 间 效 率 为 0(1) 十 OCn 一 1), 所 以 TOn)= OGD) 十 TCn 一 D) 一 2XOG) 十 TCn 一 2) 
nxO(1) 王 OCn) 。 
下 面 介绍 斐 波 那 契 (Fibonacci) 数列 的 计算 。 斐 波 那 契 数列 作为 计算 机 应 用 领域 中 很 
常见 和 很 重要 的 数列 ,可 以 用 循环 产生 ,也 可 以 用 递归 思路 来 实现 计算 。 
该 数列 的 特点 是 : 第 一 个 数据 是 1 ,第 二 个 数据 是 1, 之 后 每 一 个 数据 都 是 前 两 个 数据 
之 和 , 即 1.1.2.3.5.8\13.21.34.55…, 根 据 这 个 特点 可 以 很 容易 地 写 出 其 递归 定义 ， 


fib(num) = fib(num—1)+ fib(num— 2), 


其 结束 条 件 为 fib(1) 一 1,fib(2) 一 1。 
以 下 首先 给 出 用 递归 程序 计算 斐 波 那 契 数列 的 某 个 值 的 部 分 源码 ,然后 再 用 非 递 归程 
序 的 部 分 源码 作为 对 比 。 
【程序 源码 1-2〗 用 递归 函数 计算 辈 波 那 契 数列 的 某 个 值 。 
long int fib: :fibrecursion(long int num) 
{ 
if (num<= 2) 
return 1; // 递 归 出 口 
else 
return(fibrecursion(num ~ 1) + fibrecursion(num 一 2)); // 递 归 调用 
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【程序 源码 1-3】 用 循环 结构 计算 斐 波 那 契 数列 的 某 个 值 。 


long int fib: :fibloop( long int num) // 循 环 结构 函数 
{ 
long int backtwo, backone, currentdata; 


int count; 
if(num<= 2) 
return 1; 
else 
{ 
backtwo= 1;backone = 1; // 先 设计 两 个 基准 数据 
for(count = 3;count <= num;count++) 
{ 
currentdata = backone + backtwo; // 产 生 最 新 的 一 个 数据 
backtwo = backone; // 把 基准 数据 往 前 移动 


backone = currentdata; 
} 


return currentdata; 


} 


递归 除了 用 于 进行 一 些 数学 公式 的 计算 外 ,还 有 很 多 地 方 都 可 以 使 用 ,例如 链表 结 点 的 
构成 就 是 递归 定义 。 还 可 以 用 数学 的 抽象 进行 一 些 递归 定义 ,如 定义 一 个 概念 “梯形 ”, 此 处 
它 并 不 是 传统 的 梯形 ,特别 定义 的 “梯形 "是 由 一 个 圆 和 两 个 “梯形 "组 成 的 。 

图 1-6 为 递归 思想 在 结 点 定义 和 一 个 抽象 的 “梯形 "定义 中 的 应 用 。 


struct node ”1/ 结 点 结构 体 


{ 
一 六 | 于 | 一 > int data; /数据 上 
node *next; // 指 针 域 


ji 
I 


(a) 结 点 的 递归 形式 (b) 结 点 定义 的 递归 程序 实现 (ec) “梯形 "递归 形式 
1-6 递归 思想 的 应 用 范例 示意 图 


下 面 介绍 计算 机 经 典 问 题 “ 汉 诺 塔 难题 "。 从 前 有 一 个 人 向 一 个 庙 中 长 老 求 教 ,这 个 世 
界 到 底 什么 时 候 会 毁灭 ,他 是 想 为 难 和 取笑 一 下 这 位 长 老 。 长 老 笑 呵呵 地 告诉 他 :“ 在 我 的 
后 厢房 中 ,有 3 个 带 有 底座 的 柱子 ,分 别称 为 1 号 柱 、2 号 柱 和 3 号 柱 , 其 中 在 1 号 柱 上 有 64 
个 带 孔 且 大 小 不 一 的 圆 盘 ,从 大 到 小 往 上 放置 。 只 要 你 把 这 64 个 盘子 全 部 从 1 号 柱 移 到 3 
号 柱 上 ,这 个 世界 就 毁灭 了 。 "这 个 人 说 :“ 那 还 不 容易 ,我 一 次 把 它们 全 部 移 到 另外 一 个 柱 
子 上 不 就 完了 。” 长 老 说 :“ 是 有 附加 条 件 的 , 那 就 是 每 次 只 能 移动 一 个 盘子 ”这 个 人 说 : 
“ 那 也 容易 呀 ,我 每 次 移动 一 个 盘子 64 次 不 也 就 移 完 了 吗 ? "长 老 又 说 :“ 第 二 个 条 件 是 小 盘 
子 永 远 必 须 在 大 盘子 上 。 这 个 人 泄气 了 :“ 那 我 明白 了 ,您 不 就 是 说 无 解 吗 ,我 把 第 一 个 盘 
子 移 到 3 号 柱 上 ,第 二 个 盘子 已 经 不 能 再 往 上 面 放 了 ,不 就 是 无 解 了 嘛 。 长老 笑 着 说 :“ 那 
也 不 一 定 ,我 给 你 的 第 2 号 柱 可 以 帮助 你 呀 !” 并 且 给 他 演示 了 3 个 盘子 是 如 何 移动 的 ,他 似 
乎 明白 了 。 自 己 去 试 了 一 试 ,发 现 用 了 很 长 时 间 ,也 没有 移动 多 少 个 盘子 过 去 ,终于 放弃 了 。 

计算 机 科学 家 通过 计算 告诉 人 们 完成 长 老 所 说 的 任务 时 间 上 的 确 是 一 个 天 文 数字 。 实 
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际 上 即使 不 用 人 去 搬 盘 子 , 而 使 用 全 球 最 高 速 的 计算 机 也 要 花费 很 长 的 时 间 , 这 就 是 
O(2") 时 间 复 杂 度 算法 。 

图 1-7 为 执行 3 个 盘子 移动 的 过 程 示意 图 ,可 以 体会 到 移动 过 程 的 复杂 和 困难 。3 个 盘 
子 要 用 7 次 移动 才能 完成 移动 任务 ,而 64 个 盘子 则 需要 18 446 744 073 709 551 615 次 移动 。 


l 
[3 礼 [一 本 
1 号 柱 2 号 柱 3 号 柱 1 号 柱 2 号 柱 3 号 柱 
| | | | 
这 之 
[一 [a 
1 号 2 号 柱 3 号 柱 1 号 2 号 3 号 柱 
| | 
之 之 
[一 [5 
1 号 2 号 柱 3 号 柱 1 号 2 号 3 号 杜 
[一 
字 
1 号 柱 2 号 柱 3 号 柱 1 号 柱 2 号 柱 3 号 柱 


图 1-7 汉 诺 塔 难题 一 一 3 个 盘子 移动 过 程 示意 图 


显然 把 3 个 盘子 的 移动 思路 变 成 通用 的 算法 是 有 一 定 难度 的 ,而 通过 递归 思路 则 可 以 
轻松 解决 64 个 盘子 的 汉 诺 塔 难题 。 图 1-8 为 64 个 盘子 递归 求解 过 程 示 意图 。 


入 :二 六 二 


1 号 柱 1 号 柱 2 号 柱 3 号 柱 
[ I 
; 六 
1 号 柱 2 号 柱 3 号 柱 1 号 柱 2 号 柱 3 号 柱 


图 1-8 汉 诺 塔 难题 一 一 64 个 盘子 递归 求解 过 程 示意 图 


图 1-8 中 首先 是 64 个 盘子 的 求解 空间 ,如 果 把 虚线 当成 新 的 底座 ,就 是 少 了 一 个 盘子 
的 求解 空间 。 而 对 于 63 个 盘子 的 移动 .使 用 同样 的 思路 ,就 是 递归 思想 。 由 于 本 程序 相对 
复杂 ,所 以 下 面 给 出 了 全 部 源码 。 

【程序 源码 1-4】 求解 汉 诺 塔 问题 的 递归 程序 。 

// 功 能 : 通过 递归 实现 汉 诺 塔 问题 的 求解 


#include< conio.h> 
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# include < iostream. h> 
# include <windows.h> 
class Hanoi 
{ 
public: 
Hanoi(); 
~Hanoi(); 
void move(char pillarsource, int num, char pillartarget); 
void hanoi( int num, char pillar01,char pillar02,char pillar03); 
void startmove(void); 
private: 
int num; 


Hanoi: :Hanoi() 


人 
void Hanoi: :hanoi( int num, char pillar01, char pillar02, char pillar03) 


//pillar01 为 初始 柱 ，pillar02 为 辅助 柱 ，pillar03 为 目标 柱 


move(pillar01, 1, pillar03); 
else 
{ 
hanoi(num- 1,pillar01, pillar03, pillar02); 
move(pillar01, num, pillar03); 
hanoi(num- 1,pillar02, pillar01, pillar03); 
} 
} 
void Hanoi: :move(char pillarsource, int num, char pillartarget) 
//pillarsource 为 初始 柱 ，pillartarget 为 目标 柱 
人 
cout <<" 把 "<< num <<" 号 盘 从 第 "<< pillarsource <<" 号 柱 移 到 第 "<< pillartarget <<" 号 
柱 "<< endl; 
} 
void Hanoi: :startmove(void) 
cout <<" 请 输入 总 盘 数 :"; 
cin >> num; 
hanoi(num, '1','2','3'); 
// 主 函 数 = 
void main(void) 


{ 


system( "color £0"); 

SetConsoleTitle(" 通 过 递归 实现 汉 诺 塔 "); // 设 置 标题 
Hanoi hanoinow; 

cout <<" 通 过 递归 实现 汉 诺 塔 :"<< endl; 

hanoinow. startmove( ); 

cout <<" 任 务 完成 !!1!1"<< endl; 
system( "pause" ); 


} 
本 程序 运行 界面 如 图 1-9。 
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1-9 递归 实现 汉 诺 塔 程序 运行 界面 


1.10 本 章 总 结 


本 章 着 重 讲解 了 数据 结构 提出 的 背景 和 基础 知识 ,强调 了 数据 结构 在 程序 开发 过 程 中 
的 重要 作用 。 对 本 书 进行 了 框架 性 的 铺垫 ,给 出 了 一 批 基 本 概念 ,指出 数据 结构 主要 通过 三 
个 层次 , 即 多 辑 结构 .存储 结构 和 主要 操作 来 展开 。 从 几 个 不 同 的 角度 对 程序 设计 进行 了 归 
纳 和 总 结 ,提出 了 程序 设计 过 程 是 把 人 的 “ 面 式 思维 ”转化 为 计算 机 的 “点 式 思 维 ” 的 重要 思 
想 方 法 ,简要 介绍 了 算法 的 时 间 ,空间 效率 分 析 , 这 对 于 评价 算法 的 优 劣 有 很 大 的 作用 。 还 
讨论 了 递归 的 概念 和 应 用 ,为 后 面 的 程序 设计 奠定 了 基础 。 


习 题 


一 、 原 理 讨 论题 

. 学 完 1.3 节 多 案例 之 后 的 收获 与 思考 有 哪些 ? 

. 数值 计算 和 非 数值 计算 的 区 别 有 哪 些 ? 

. 简 述 数据 结构 发 展 的 历程 。 

. 程序 设计 的 三 门 主要 基本 课程 是 什么 ? 它们 的 关系 是 什么 ? 

. 数据 结构 分 哪 几 个 层次 展开 ? 

. 逻辑 结构 ,存储 结构 的 关系 是 什么 ? 

. 好 算法 的 标准 是 什么 ? 

. 为 什么 不 通过 程序 的 运行 直接 讨论 速度 快慢 而 讨论 算法 的 时 间 效 率 ? 

. 通常 如 何 分 析 算法 的 时 间 效 率 复杂 度 ? 

0. 为 什么 重点 讨论 时 间 效 率 而 不 是 重点 讨论 空间 效率 ? 

1. 如 何 看 待 面 式 思维 和 点 式 思维 的 关系 ? 举例 说 明 。 

. 数据 在 存储 时 有 哪 几 种 特性 ? 

、 理 论 基 本 题 

. 解释 概念 : 数据 、 数 据 元 素 数据 项 、 数 据 结构 、 逻 辑 结构 存储 结构 、 算 法 。 
. 写 出 逻辑 结构 的 分 类 。 

. 写 出 存储 结果 的 分 类 ,用 读者 自己 提供 的 5 个 数据 重 画 顺序 存储 和 链接 存储 等 两 种 


一 oT Do 


i 祝 
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4. 写 出 基本 操作 清单 。 

5. 写 出 常用 的 算法 时 间 复 杂 度 。 

三 、 编 程 基本 题 ( 注 : 程序 设计 基本 功 比 较 好 的 读者 可 以 跳 过 ) 
1. 在 屏幕 上 显示 一 句 话 : 数据 结构 充满 魅力 !11 

2. 在 屏幕 上 仅仅 显示 一 个 菜单 ,大 致 内 容 和 效果 如 下 : 


某 种 数据 结构 功能 菜单 
作者 : xxxxxx 


3. 继续 上 个 程序 ,同时 用 户 可 以 给 一 个 键盘 响应 (注意 变量 定义 ), 大 致 内 容 和 效果 如 
下 (菜单 用 上 面 的 ): 


请 输入 您 的 选择 : 


4. 继续 上 个 程序 ,在 程序 内 部 添加 对 菜单 的 处 理 , 主 要 是 通过 switch 请 句 调 用 不 同 的 
函数 。 

5. 编程 求 两 个 整数 的 加 法 ,要 求 界面 效果 大 致 如 下 : 

请 输入 第 一 个 数据 : 12 

请 输入 第 二 个 数据 : 15 

12+15=27 

6. 编程 把 上 个 程序 变 成 同时 显示 和 输出 到 一 个 文本 文件 中 ,文件 名 约定 为 : 两 数 相 加 
程序 结果 . txt。 要 求 文件 中 的 效果 和 屏幕 显示 完全 一 样 。 

7. 继续 第 5 道 题 程序 的 修改 ,由 于 程序 在 编辑 环境 中 编译 后 ,执行 完毕 时 会 提示 Press 
any key to continue, 而 在 Debug 下 的 可 执行 程序 并 不 停止 而 直接 退出 ,导致 部 分 显示 信息 
看 不 到 ,所 以 在 程序 最 后 增加 一 个 读 取 键盘 字符 的 功能 ,使 之 等 竺 用户 击 键 后 才 退 出 。 

8. 继续 修改 第 7 题 的 结果 ,使 之 可 以 反复 运行 ,用 户 可 以 选择 字母 y 继续 运行 ,或 直到 
用 户 选择 字母 n 后 结束 程序 (不 论 大 小 写 ) 。 

9. 继续 修改 第 8 题 的 结果 ,在 用 户 选择 字母 y 继续 运行 时 先 清 屏 一 次 。 

10. 构建 结 点 ,内 容 为 数据 域 ( 整 数 型 ,名 为 data) 和 指针 域 ( 名 为 next) 。 主 函数 中 申请 
一 个 新 结 点 ,从 键盘 输入 一 个 整数 ,把 数据 和 空地 址 分 别 存 人 该 结 点 的 两 个 域 ,之 后 在 屏幕 
输出 该 结 点 的 内 容 。 

11. 一 个 文本 文件 (名 为 : 基础 数据 . txt) 中 有 不 多 于 10 个 的 整数 ,从 中 读 出 写 入 一 个 
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数组 (名 为 basedata) 中 ,然后 用 循环 语句 把 数组 中 的 全 部 数据 显示 在 屏幕 上 。 

12. 一 个 文本 文件 (名 为 : 基础 数据 . txt) 中 有 不 多 于 10 个 的 整数 ,从 中 读 出 写 和 人 一 个 
链表 (名 为 headp) 中 ,然后 用 循环 语句 把 链表 中 的 全 部 数据 显示 在 屏幕 上 。 

13. 用 计算 机 产生 随机 数 (0 一 1000)10 个 , 写 和 一 个 链表 (名 为 headp) 中 ,然后 用 循环 
语句 把 链表 中 的 全 部 数据 显示 在 屏幕 上 。 

14. 一 个 文本 文件 (名 为 : 城市 间 基础 数据 . txt) 中 有 多 组 数据 ,格式 和 类 型 如 下 所 示 ， 
从 中 读 出 写 人 一 个 结构 体 数组 (名 为 basedata) 中 ,然后 用 循环 语句 把 数组 中 的 全 部 数据 显 
示 在 屏幕 上 (形式 和 文件 中 一 样 ) 。 

出 发 城市 目标 城市 ”公里 数 

北京 上 海 1463 
大 连 沈阳 397 
广州 西安 2111 
昆明 太原 2593 
武昌 长 沙 853 

15. 改造 第 14 题 ,使 数据 存 人 链表 (出 发 城市 ,sourcecity, 目 标 城市 ,targetcity, 公 里 
数 ,kilometers, 链 域 ,next) ,之 后 从 链表 依次 读 出 ,在 屏幕 显示 ,此 时 增加 一 列 运 费 (运费 = 
公里 数 X0.07), 同 时 把 带 运费 的 全 部 数据 再 写 入 一 个 文本 文件 中 (名 为 : 城市 间 基 础 数据 
与 运费 . txt) 。 

16. 有 多 行 的 两 列 数据 ,每 一 行 的 第 一 列 和 第 二 列 数 据 比较 ,保证 先 小 后 大 。 但 是 如 果 
相等 , 则 同时 清 零 ,要 求 转 换 前 后 的 数据 要 对 比 显 示 。 要 求 编程 做 到 计算 机 提供 随机 数据 、 
手工 输入 .有 反复 运行 等 功能 。 如 

12 34 

25 50 

38 16 


45 45 
18 68 


转换 为 


四 、 编 程 提高 题 

1. 如 果 编 程 实现 九 九 乘法 表 , 应 如 何 实现 ? 一 般 在 输入 numl 和 num2 后 计算 result 一 
numlXnum2 ,然后 输出 结果 。 此 时 本 算法 的 时 间 复 杂 度 为 0(1), 显 然 已 经 到 达 最 低 时 间 
复杂 度 ,而 且 本 身 计算 过 程 已 经 利用 系统 提供 的 乘法 ,如 果 还 要 继续 提高 时 间 效率 ,设计 出 
该 实现 方案 。 

五 、 思 考题 

1. 在 一 个 8X8 的 棋盘 上 ,要 求 放置 8 个 皇后 ,考虑 到 皇后 之 间 的 关系 复杂 ,要 求 任 意 
皇后 不 能 出 现在 同一 行 、 同 一 列 、 两 个 斜 向 45" 的 线性 序列 上 。 如 何 才能 达成 目标 ,特别 是 
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计算 机 如 何 存储 这 些 棋盘 信息 和 皇后 信息 ,又 如 何 通 过 编程 运行 后 确定 一 种 或 全 部 可 能 的 
布局 ? 试 画 出 一 个 4 皇后 的 模型 ,并 且 给 出 一 个 解 ( 暂 时 不 需要 编程 ,后 面 会 继续 讨论 这 个 
专题 ) 。 

2. 大 学 4 年 中 ,学 生 要 进行 很 多 门 课程 的 学 习 , 还 有 实习 、 课 程 设计 、 毕 业 设计 等 各 种 
培养 活动 。 那 么 构造 教学 培养 计划 时 如 何 能 分 析 清 楚 所 有 这 些 活动 的 先后 逻辑 关系 ,哪些 
是 后 续 的 前 提 , 哪 些 可 以 安排 在 同一 个 学 期 学 习 而 且 没 有 困难 ? 这 些 关 系 必须 讨论 清楚 而 
且 要 设计 出 对 应 的 存储 结构 。 类 似 的 系统 还 有 大 型 工程 管理 系统 等 。 

3. 对 于 图 书馆 中 成 千 上 万 的 图 书 希 望 通过 多 种 方法 进行 查询 ,如 何 才 能 建立 一 套 行 之 
有 效 的 快速 查找 方案 ? 不 论 是 作者 、 出 版 社 , 书 名 等 主要 信息 ,还 是 价格 、 页 数 等 细节 信息 ， 
甚至 内 容 提 要 ,目录 等 信息 ,如 果 可 以 查询 又 如 何 完成 ? 诸如 此 类 的 还 有 电话 自动 查 号 系 
统 、 考 试 查分 系统 、 仓 库 库 存 管理 系统 、 人 事 管理 系统 等 。 在 这 类 信息 管理 的 模型 中 ,数据 量 
巨大 ,需要 考虑 如 何以 最 快 的 速度 完成 查询 。 

4. 股市 中 有 大 量 的 股票 基本 信息 和 公司 背景 信息 ,还 有 开盘 后 实时 动态 数据 股民 的 
资金 和 买卖 数据 等 ,如 果 要 产生 周 线 月 线 、 年 线 等 ,还 要 计算 相应 时 间 段 内 的 所 有 股票 价格 
的 最 大 值 和 最 小 值 等 。 本 来 存储 量 巨大 ,关系 复杂 就 是 一 个 大 问题 ,但 是 为 达到 全 国 所 有 营 
业 部 和 个 人 网 上 用 户 能 够 公平 地 交易 ,数据 传输 的 延迟 就 不 能 太 大 ,甚至 要 求 在 60s 内 就 要 
传输 到 全 国 各 地 ,如 此 大 规模 的 数据 要 在 实时 情况 下 快速 传输 ,如 何 实现 ? 更 重要 的 是 股票 
系统 涉及 大 量 金融 信息 ,在 传输 过 程 中 如 何 保证 不 被 自 改 、 不 被 盗窃 、 不 被 非法 利用 ? 这 些 
系统 的 功能 和 数据 结构 以 及 如 何 存储 都 有 着 很 大 的 关系 。 类 似 的 系统 有 远程 医疗 手术 
系统 。 


生 


第 2 章 ”线性 表 的 构造 与 应 用 


本 章 介绍 第 一 种 基本 的 数据 结构 一 一 线性 表 , 以 及 它 的 迎 辑 结构 ,存储 结构 的 实现 ,包括 
顺序 表 和 链表 ,分 析 各 自 的 优 缺 点 ,讨论 基本 操作 的 算法 设计 和 时 间 效率 分 析 , 最 后 介绍 线性 
表 的 应 用 案例 。 线 性 表 是 最 基本 的 数据 结构 形式 ,构成 了 其 他 各 种 复杂 数据 结构 的 基础 。 


2.1 引 言 


线性 关系 是 现实 生活 中 最 简单 .最 基本 、 最 常用 的 一 种 结构 ,所 有 以 单行 或 单列 的 形式 
构成 的 数据 关系 都 是 线性 表 的 一 种 范例 。 例 如 ,军队 中 一 个 班 的 士兵 站 立成 一 行 。 既 然 现 
实生 活 中 可 以 把 人 用 一 行 来 管理 ,那么 在 程序 设计 中 也 可 以 把 很 多 人 的 相关 信息 用 所 谓 的 
一 维 线性 结构 来 表达 。 

例 2-1 现实 生活 中 线性 表 的 范例 很 多 ,如 表 2-1 所 示 的 学 生 考 试 成 绩 单 ,虽然 每 一 行 
有 很 多 信息 ,但 是 把 一 个 学 生 的 全 部 信息 看 成 一 个 整体 .那么 数据 之 间 的 关系 就 是 从 上 到 下 
的 一 维 关系 。 


表 2-1 学 生 考 试 成 绩 单 


、 计算 机 | C++ 高 级 数据 库 | 数据 库 
姓名 | 学 生 证 号 基础 语言 数据 结构 | 操作 系统 原理 系统 软件 工程 | ”总 分 
蒋 文 | 2005501 75 78 69 73 80 81 79 535 
沈 武 | 2005502 82 84 83 79 86 74 88 576 
韩 万 | 2005503 85 74 86 81 75 73 82 556 
杨 略 | 2005504 68 72 81 75 73 80 79 528 
朱 全 | 2005505 81 87 90 78 86 90 88 600 


2.2 线性 表 的 逻辑 结构 


线性 表 是 一 批 数 据 以 一 维 关系 组 织 的 线性 结构 。 其 特点 是 ,当前 数据 有 直接 关系 的 下 
一 个 数据 只 有 一 个 数据 元 素 ( 从 一 个 特定 的 方向 看 ) ,数据 元 素 一 个 接 一 个 地 排列 (最 后 一 个 
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数据 除外 ) ,通常 称 为 线性 关系 。 

在 程序 实现 中 ,一 个 线性 表 中 数据 元 素 的 类 型 应 该 是 相同 的 , 故 线性 表 是 由 同一 类 型 
的 有限 个 数据 元 素 构成 的 线性 结构 。 

线性 表 是 具有 相同 数据 类 型 的 n(n 宇 0) 个 数据 元 素 的 有 限 序 列 , 通 常 记 为 (ai ,az ,… 
aiyaiyatl,…yan)。 上 述 记 法 中 的 mn 为 表 长 ,也 就 是 数据 元 素 的 个 数 。 数 据 结构 存在 的 情 
况 下 通常 可 以 是 无 数据 的 ,初始 化 数据 结构 后 ,如 线性 表 n= 二 0 时 称 其 为 空 表 。 

线性 表 中 相 邻 元 素 之 间 存 在 一 个 次 序 关系 。 通 常 将 a-: 称 为 ai 的 直接 前 趋 (通常 书写 
上 ai-i 在 ai 的 左边 ) ,ai 称 为 ai 的 直接 后 继 (书写 上 at 在 ai 的 右边 )。 对 于 a, 当 i=1， 
2,…,n 时 ,有 且 仅 有 一 个 直接 前 趋 a;_1, 当 i==1,2,…,n 一 1 时 ,有 且 仅 有 一 个 直接 后 继 
ait1; 而 a 是 表 中 第 一 个 元 素 , 它 没有 前 趋 ,a, 是 最 后 一 个 元 素 , 没 有 后 继 。 这 种 有 限 性 是 
由 计算 机 存储 空间 的 有 限 性 决定 的 。 

ai 是 序号 为 i 的 数据 元 素 (i 王 1,2,…',n) ,在 编程 中 应 根据 实际 情况 决定 其 内 容 和 数据 
类 型 ,如 有 时 可 以 把 数据 类 型 抽象 为 DataType, 在 具体 编程 时 DataType 根据 具体 情况 决定 
修改 成 整 型 变量 为 int, 则 在 程序 头 部 加 上 类 似 下 面 的 语句 即 可 : 


typedef int DataType; 

一 般 而 言 ,对 于 线性 表 的 操作 是 定义 在 迎 辑 结构 层面 上 的 ,因为 操作 是 数据 的 最 终 用 户 
根据 实际 情况 提出 的 要 求 。 操 作 的 具体 编程 则 依赖 于 存储 结构 ,不 同 的 存储 结构 必然 导致 
编程 的 不 同 。 线 性 表 的 基本 运算 作为 逻辑 结构 的 一 部 分 ( 见 表 2-2) ,每 个 操作 的 具体 编程 
在 确定 了 存储 结构 后 才能 完成 。 


表 2-2 线性 表 的 主要 操作 


操作 名 称 建议 算法 名 称 说 明 
线性 表 初 始 化 | create(list) 初始 条 件 : 表 list 不 存在 。 功 能 : 构造 一 个 空 的 线性 表 
求 线性 表 长 度 | length(list) 初始 条 件 : 表 list 存在 。 功 能 : 返回 线性 表 中 所 含 元 素 的 个 数 


初始 条 件 : 表 list 存在 且 1<i<length(list) 
功能 : 返回 线性 表 list 中 的 第 i 个 元 素 的 值 


初始 条 件 : 表 list 存在 。 功 能 : 用 newitem 修改 线性 表 list 中 
第 i 个 位 置 的 数据 


初始 条 件 : 线性 表 list 存在 。value 是 用 户 希 望 查 找 的 数据 元 
素 , 可 以 从 键盘 等 机 制 临时 提供 。 功 能 : 在 表 list 中 查找 值 为 
按 值 查找 locate(list,value) value 的 数据 元 素 ,其 结果 返回 在 lsit 中 首次 出 现 的 值 为 value 
的 元 素 的 序号 或 地 址 ,表示 查找 成 功 ; 如 果 在 list 中 未 找到 值 
为 value 的 数据 元 素 , 则 返回 一 个 特殊 值 表示 查找 失败 


读 取 表 中 数据 | get(list'i) 


替换 操作 replace(list,i,newitem); 


初始 条 件 : 线性 表 list 存在 ,插入 位 置 正确 (1<i<n 十 1,n 为 
插入 前 的 表 长 )。n 十 1 的 位 置 正确 是 因为 可 以 把 新 数据 放 在 
原 有 数据 的 最 后 面 。 功 能 : 在 线性 表 list 的 第 i 个 位 置 上 插 
入 一 个 值 为 newitem 的 新 元 素 ,插入 后 , 表 长 二 原 表 长 十 1 


插入 操作 insert(list,i, newitem) 
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续 表 
操作 名 称 建议 算法 名 称 说 明 
初始 条 件 : 线性 表 list 存在 ,1<i<n。 功 能 : 在 线性 表 list 中 
删除 序号 为 i 的 数据 元 素 ,删除 后 , 表 长 二 原 表 长 一 1 
初始 条 件 : 表 list 存在 。 功 能 : 有 规律 地 访问 线性 表 中 全 部 
数据 各 一 次 且 最 多 一 次 


删除 操作 Temove(list,i) 


遍历 线性 表 traverse( list) 


以 上 操作 并 不 是 线性 表 的 全 部 操作 ,只 是 一 些 最 常用 、 最 基本 的 操作 (本 书 介 绍 的 其 他 
数据 结构 类 似 ) ,而 每 一 个 基本 操作 在 编程 时 根据 不 同 的 存储 结构 也 会 派生 出 其 他 相关 操 
作 。 如 检测 是 否 为 空 (empty), 即 数据 量 为 0; 或 是 否 为 满 (full) , 即 分 配 的 空间 已 经 用 完 。 

例如 ,线性 表 的 查找 操作 在 链接 存储 结构 中 就 可 能 会 有 按 序号 查找 ; 再 如 插入 运算 ,也 
可 能 是 变形 为 同时 插入 多 个 数据 等 ,有 时 会 对 所 有 数据 进行 反 序 操作 。 

在 掌握 了 基本 操作 后 ,其 他 的 操作 可 以 通过 基本 操作 进行 组 合 或 改编 ,也 可 以 另外 编程 


2.3 线性 表 的 顺序 存储 


线性 表 的 顺序 存储 是 指 在 内 存 中 启用 地 址 编号 连续 的 一 批 存储 空间 ,依次 存放 线性 表 的 
全 部 数据 ,这 种 存储 形式 叫 * 顺 序 存储 "。 把 线性 表 用 顺序 存储 实现 ,可 以 简称 为 “顺序 表 ”。 

在 编程 实现 顺序 表 时 ,可 以 采用 多 种 方案 ,但 是 通常 最 简单 的 方法 就 是 采用 高 级 语言 中 
的 一 维 数组 , 它 的 下 标 有 助 于 理解 线性 表 顺 序 存 储 的 构造 和 编程 设计 细节 。 

为 了 程序 更 加 通用 ,可 以 把 数组 定义 为 dataarrayLMAXSIZE], 其 中 MAXSIZE 是 一 个 
整数 ,在 程序 头 部 用 类 似 const MAXSIZE 二 100; 的 请 句 定义 ,这 样 一 旦 需要 修改 ,比较 容 

在 实际 编程 中 要 启用 一 个 变量 如 last 来 记录 最 后 一 个 数据 的 下 标 地 址 ,这 样 才能 知道 
哪些 是 线性 表 中 的 有 效 数据 。 表 空 时 约定 last== 一 1 ,这样 在 编程 时 last 十 十 或 last 一 一 等 
语句 一 直 有 效 。 

以 上 的 讨论 在 程序 中 类 似 下 面 的 程序 段 : 

const MAXSIZE = 100; 

int dataarray [MAXSIZE]; 

int last; 

顺序 表 的 两 个 范例 如 图 2-1 所 示 。 定 义 MAXSIZE 为 11, 因 此 有 0 到 10 号 单元 ,数据 
个 数 为 6 个 ,在 启用 了 0 号 单元 时 , 表 长 为 last 十 1, 数 据 元 素 分 别 存放 在 dataarray[0] 到 
dataarray[last] 中 。 

0 号 地 址 对 应 第 一 个 数据 ,第 i 个 数据 在 第 i 一 1 号 地 址 ,理解 起 来 有 些 困难 。 为 了 逻辑 
上 比较 清晰 ,可 以 主动 放弃 使 用 这 个 单元 ,从 1 号 单元 开始 存放 实际 数据 ,这 样 第 i 个 数据 
正好 就 放 在 第 i 个 地 址 中 ,理解 起 来 比较 简单 。 但 是 这 个 约定 可 能 引起 其 他 变化 ,如 编程 中 
很 多 相关 地 址 的 细节 都 要 做 相应 改变 ,如 : 在 不 用 0 号 单元 后 线性 表 的 长 度 正 好 是 last, 而 
不 是 last 十 1 了 。 
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dataarray dataarray 
0 12 345 6 7 了 8 9 10 和 . 放 - 交 娄 性 7 8 9 10 
6 | 0 17 |87 [os [07 | | | | | | 加 四 四 加 轩 品 | | 
last last 
使 用 0 号 单元 的 情况 不 使 用 0 号 单元 的 情况 


2-1 线性 表 的 顺序 存储 示意 图 


由 于 顺序 存储 中 内 存 地 址 是 线性 相 邻 的 ,因此 物理 上 的 相 邻 数据 关系 正好 吻合 了 数据 
之 间 的 逻辑 相 邻 关系 ,因此 这 种 存储 方法 的 优点 既 简 单 又 自然 。 通 过 地 址 计算 公式 ,可 以 对 
任何 一 个 数据 直接 进行 访问 ,这 样 读 写 一 个 数据 就 和 数据 量 无 关 了 ,显然 这 是 一 个 非常 好 的 
特性 。 通 常 把 这 种 数据 访问 方式 称 为 随机 访问 。 

随机 访问 特性 指 的 是 可 以 直接 访问 任意 一 个 数据 ,所 以 必须 有 地 址 计算 公式 作为 前 提 。 

设 a 的 存储 地 址 为 Loc(ai) ,每 个 数据 元 素 占 用 d 个 存储 地 址 , 则 第 i 个 数据 元 素 的 地 
址 为 : 

Loc(ai) = Loc(al) 十 (i 一 1)*<*d (1<i<n) 

就 是 说 ,只 要 知道 顺序 表 的 第 一 个 数据 的 存储 地 址 (简称 “ 首 地 址 ”) 和 每 个 数据 所 占用 地 址 
单元 的 数目 就 可 求 出 第 i 个 数据 元 素 的 地 址 。 

在 C++ 中 ,数组 的 下 标 约定 从 0 开始。 如果 下 标 从 0 开始 , 则 地 址 计算 公式 变 成 ， 

Loc(ai) = Loc(ao) 十 ixd (0 委 i 委 nn 一 1) 

这 个 公式 中 减少 了 一 次 减法 运算 ,如 果 把 类 似 的 操作 固化 在 硬件 上 ,就 可 以 加 快 软件 的 运行 
速度 。 这 也 是 计算 机 科学 家 们 在 数组 的 实现 设计 时 启用 0 号 单元 的 理由 之 一 。 

线性 表 的 操作 中 最 主要 的 是 插入 、 删 除 等 动态 操作 ,因此 表 长 不 断 变 化 。 而 数组 的 容量 
和 实际 线性 表 中 的 表 长 是 不 同 的 概念 。 高 级 语言 中 ,静态 数组 通常 需要 先 申 请 后 使 用 ,如 果 
数组 空间 已 经 用 完 , 还 需要 继续 插入 数据 ,这 时 就 会 引起 操作 失败 ,这 种 情况 称 为 “上游 ”。 

下 面 讨论 线性 表 中 插入 操作 的 完成 。 如 果 要 在 线性 表 已 有 数据 中 间 插 入 一 个 数据 , 必 
然 导致 一 批 数据 的 移动 ,因为 必须 为 准备 插入 的 数据 腾 出 一 个 地 址 空间 。 如 图 2-2 所 示 ,这 
个 顺序 表 中 在 2 号 单元 插入 了 12。 在 移动 数据 过 程 中 可 以 看 到 ,last 暂时 没有 动 ,2 号 单元 
依然 还 有 一 个 17。 插 入 完成 后 ,这 两 个 细节 都 已 经 恢复 到 正确 值 。 


dataarray 
0 1 2 3 4 5 6 7 8 9 10 
[slo EE o7 | | | 
eT 
\_\ _\ last\ 7 
dataarray M@\@NG@ NAG dataarray ee 
0 1 2 当当 7 8 9 10 0 1 2:3 4 5 6 7 8 9 1 
[slo | |w 05 | 07 | | 四 四 四 加 区 os [07| 
last last 
移动 数据 过 程 最 后 完成 插入 过 程 


图 2-2 顺序 表 插 入 操作 的 示意 图 
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在 顺序 表 上 完成 插入 操作 通过 以 下 步骤 进行 : 将 as 一 as( 反 向 ) 向 后 移动 ,为 新 元 素 空 
出 空间 ; 将 新 元 素 置 人 空 出 的 第 i 个 位 置 ; 修改 last( 相 当 于 修改 表 长 ) ,使 之 仍 指向 最 后 一 
个 元 素 。 

由 于 C++ 语言 中 没有 提供 整体 移动 数据 的 语句 ,那么 就 必须 编程 来 实现 逐个 数据 的 移 
动 ,通过 上 面 示意 图 的 讨论 可 以 看 到 ,必须 从 线性 表 的 后 部 开始 移动 ,才能 保证 程序 的 正确 
性 。 根据 人 的 阅读 习惯 是 从 左 到 布 ,从 面 式 思维 的 角度 看 ,可 以 把 这 种 移动 称 为 “ 反 
向 移动 ”。 

根据 顺序 表 的 定义 和 存储 特性 ,如 果 要 在 线性 表 中 删除 一 个 数据 ,不 会 是 做 一 个 “ 空 
洞 ”, 也 不 是 用 另外 一 个 特殊 值 来 “填充 ” 它 ,正确 的 方法 是 把 后 面 的 数据 往 前 移动 ,因为 顺序 
存储 的 定义 是 要 求 连续 存放 数据 ,这 样 才能 保持 随机 访问 特性 的 正确 性 。 如 图 2-3 所 示 ,这 
个 顺序 表 中 在 2 号 单元 删除 了 17。 由 于 在 数据 移动 中 会 产生 数据 覆盖 ,所 以 这 其 中 含有 一 
定 的 危险 ,进行 删除 操作 之 前 建议 提示 一 次 。 另 外 移动 完毕 后 last 被 移动 到 4 号 单元 ,实际 
上 5 号 单元 中 还 有 一 个 07, 但 是 由 于 last 定义 为 指向 最 后 一 个 元 素 , 故 它 已 经 不 属于 这 个 
线性 表 了 。 类 似 上 面 * 反 向 ”移动 的 理由 ,这 里 的 移动 过 程 被 称 为 * 正 向 ”移动 。 

dataarray 
0 1 2 3 4 5 6 7 8 9 10 


[s 01|17|87|05|07 | 
7 7 


1 
7/ 1/ slast 


让 
dataarray /QD/®,/® dataarray 
0 1 2 3 4 5 6 7 8 9 10 0 5 6 7 10 
[s 01|87|05|07|07 | 回回 回国 加 加 | | | | 
last last 
移动 数据 过 程 最 后 完成 删除 过 程 


图 2-3 顺序 表 删 除 操作 的 示意 图 


在 顺序 表 上 完成 删除 操作 的 步骤 如 下 : 将 ar 一 an( 正 向 ) 向 前 移动 ,修改 last 指针 ( 相 
当 于 修改 表 长 ) 使 之 仍 指向 最 后 一 个 元 素 。 

下 面 给 出 顺序 表 常 用 功能 的 程序 源码 ,考虑 到 读者 编写 第 一 个 规模 较 大 的 数据 结构 程 
序 时 会 遇 到 各 种 困难 ,所 以 本 程序 给 出 了 全 部 源码 和 详细 的 注释 。 以 后 的 程序 源码 中 界面 、 
菜单 和 用 户 响应 处 理 等 非 关键 功能 将 不 再 提供 程序 源码 。 读 者 可 以 根据 这 个 程序 源码 自己 
进行 模仿 改编 。 

【程序 源码 2-1】 顺序 表 实现 线性 表 功 能 的 程序 源 代 码 如 下 : 

// 功 能 : 完成 线性 表 的 新 建 、 显 示 、 插 入 、 删 除 、 读 取 、 修 改 、 求 表 长 度 、 数 据 反 转 等 功能 


# include < iostream.h> // 读 入 必须 包含 的 头 文件 

# include < windows.h> // 清 屏 和 颜色 设置 需要 

# include < iomanip.h> // 设 置 显示 宽度 要 用 

const Maxsize = 20; // 定 义 线性 表 的 最 大 长 度 

enum returninfo{ success, fail, overflow, underflow, range_error};  // 定 义 返 回信 息 清单 
class seqlist // 定 义 一 个 线性 表 类 seqlist 

t 

protected: 
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int dataarray[Maxsize]; 
int count; 
public: 
seqlist(); 
~seqlist(); 
returninfo create(int number); 
bool empty(void) const; 
int length(void) const; 
returninfo traverse(void); 
returninfo get( int position, int &item) const; 
returninfo replace(int position, const int &item); 
returninfo insert(int position, const int &item); 
returninfo remove( int position); 
returninfo invertlist(void); 
}; 
seqlist::seqlist() 
{ 
count = 0; 
J 
seqlist::~seqlist() 
{ 
} 
// 本 程序 输入 数据 使 用 的 是 键盘 输入 
// 数 据 个 数 由 number 通过 参数 传人 ,然后 用 count 控制 
returninfo seqlist: :createl( int number) 
{ 
count = number; 
cout <<" 请 依次 输入 数据 (用 空格 隔 开 ) :"; 
for(int i=0;i<count;i++) 
cin>> dataarray[ i]; 
return success; 


} 


// 数 据 域 数组 
// 计 数 器 ,统计 结 点 个 数 , 即 线性 表 的 长 度 


// 构 造 函数 ,用 于 对 象 的 初始 化 
// 析 构 函 数 ,用 于 对 象 消失 前 的 善后 处 理 
// 顺 序 表 的 初始 化 

// 判 断 顺 序 表 是 否 空 

// 求 顺序 表 的 长 度 

// 遍 历 顺 序 表 所 有 元 素 

// 读 取 一 个 结 点 

// 修 改 一 个 结 点 

// 插 入 一 个 结 点 

// 删 除 一 个 结 点 

// 顺 序 表 所 有 数据 反 转 


// 构 造 函数 
// 计 数 器 清 零 ,表明 开始 时 没有 实际 数据 


// 析 构 函 数 


// 由 于 用 count 记录 实际 数据 量 , 所 以 根据 它 是 否 为 0 就 知道 该 表 是 否 为 空 


bool seqlist: :empty(void)const 
{ 
if(count == 0) 
return true; 
else 
return false; 


L 


// 判 断 是 否 为 空 


//count 作为 计数 器 ,统计 线性 表 的 数据 个 数 ,所 以 返回 该 值 即 可 


int seqlist: :length(void)const 
{ 
return count; 


} 


// 求 顺序 表 的 长 度 


// 在 屏幕 上 显示 所 有 数据 ,是 一 个 最 基本 的 操作 , 称 为 遍历 


// 在 顺序 表 中 ,注意 是 通过 下 标 不 断 往 后 变化 造成 的 
returninfo seqlist: :traverse(void) 
{ 
if(empty()) 
return underflow; 


// 遍 历 顺序 表 中 的 所 有 元 素 


// 空 表 时 的 意外 处 理 
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cout <<" 顺 序 表 中 的 全 部 数据 为 : "; // 提 示 显 示 数 据 开始 
for(int i=0;i<count;it+) // 循 环 显示 所 有 数据 
cout <<" "<< setw(3)<< dataarray[ i]; // 注 意 控制 宽度 的 技巧 
cout << endl; // 最 后 有 一 个 回 车 
return success; // 返 回 操作 成 功 的 信息 


} 
// 给 定 特定 位 置 ,把 相关 数据 显示 在 屏幕 上 
returninfo seqlist: :get(int position，int &item) const // 读 取 一 个 元 素 


t 
if(empty()) // 空 表 时 的 意外 处 理 
return underflow; 
if(position<=0||position> count) // 位 置 不 正确 的 意外 处 理 
return range_error; 
item = dataarray[ position— 1]; // 返 回 读 取 的 数据 ,因为 从 0 下 标 开始 
return success; // 返 回 操作 成 功 的 信息 
} 


// 利 用 刷新 覆盖 特性 ,把 新 的 数据 覆盖 掉 旧 的 数据 就 是 修改 
returninfo seqlist: :replace( int position, const int &item) // 修 改 一 个 元 素 
{ 
if(empty()) 
return underflow; 
if(position<=0||position> count) 
return range_error; 
dataarray[ position — 1] = item; // 实 际 修改 数据 的 语句 
return success; 
} 
// 重 点 操作 : 顺序 表 中 插入 一 个 元 素 ,除了 放 在 最 后 一 个 元 素 后 面 
// 其 他 位 置 的 插入 会 导致 数据 的 移动 ,这 个 移动 是 通过 循环 完成 的 
returninfo seqlist: :insert(int position, const int &item) // 插 入 一 个 元 素 
{ 
if(count +1>= Maxsize) 


return overflow; // 上 溢 处 理 
if(position<=0 || position> count+ 1) 
return range_error; // 位 置 出 错 处 理 
for(int i= count +1;i>= position;i——) // 循 环 移动 数据 
{ 
dataarray[i] = dataarray[i—1]; // 这 里 的 移动 称 为 " 反 向 移动 " 
} 
dataarray[ position -1] = item; // 把 新 数据 放 入 正确 的 位 置 
Count++; // 计 数 器 加 1, 最 后 要 改变 数据 量 这 个 操作 


return success; 
} 
// 重 点 操作 : 删除 顺序 表 中 一 个 元 素 ,除了 最 后 一 个 元 素 
// 其 他 位 置 的 删除 会 导致 数据 的 移动 ,这 个 移动 是 通过 循环 完成 的 
returninfo seqlist: :remove(int position) // 删 除 一 个 元 素 
{ 
if(empty()) 
return underflow; 
if(position<= 0||position> count) 
return range error; 
for(int i= position— 1;i<count;i++) // 循 环 移动 数据 
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dataarray[i] = dataarray[i+1]; // 这 里 的 移动 称 为 " 正 向 移动 " 
count ——; // 计 数 器 减 1 
return success; 
. 
// 把 所 有 数据 反 转 可 以 体会 利用 数学 知识 进行 编程 的 技巧 
returninfo seqlist: :invertlist(void) // 顺 序 表 所 有 数据 反 转 
‘ 
int halfpos, tempdata; // 定 义 变量 
// 用 于 中 间 位 置 的 记录 和 交换 数据 用 的 中 间 变 量 
if(empty()) 
return underflow; // 下 游 处 理 
halfpos = count/2; // 求 中 间 的 位 置 , 自动 取 整 


// 这 里 巧妙 地 利用 了 自动 取 整 ,对 于 偶数 个 数据 和 奇数 个 数据 都 正确 
for(int i=0;i<halfpos;i++) 
{ 
tempdata = dataarray[ i]; 
dataarray[i] = dataarray[count ~- 1— i]; 
dataarray[count ~ 1 -~ i] = tempdata; // 经 典 的 三 句 交 换 数据 
} 
return success; // 返 回 成 功 信息 


// 下 面 为 界面 专门 设计 一 个 对 象 


class interfacebase 


{ 


private: 
seqlist listonface; 

public: 
void clearscreen(void); // 清 屏 
void showmenu( void); // 显 示 菜 单 
int userchoice(void); // 用 户 响 应 
returninfo processmenu( int menuchoice); // 处 理 菜单 


]} 


void interfacebase: :clearscreen(void) 


{ 


system("cls"); 


void interfacebase: :showmenu( void) 


. 


cout <<" 顺 序 表 基 本 功能 菜单 "<< endl; 


cout <<"1. 输 入 数据 (键盘 输入 ) "<< endl; 

cout <<"2. 显 示 数 据 (遍历 全 部 数据 ) "<< endl; 
cout <<"3. 修 改 数据 (要 提供 位 置 和 新 值 ) "<< endl; 
cout <<"4. 插 人 数据 (要 提供 位 置 和 新 值 ) "<< endl; 
cout <<"5. 删 除数 据 (要 提供 位 置 ) "<< endl; 

cout <<"6. 读 取 数 据 (要 提供 位 置 ) "<< endl; 

cout <<"7. 求 表 长 度 "<< endl; 

cout <<"8. 数 据 反 转 ( 全 部 数据 道 序 存储 ) "<< endl1; 
cout <<"9. 结 束 程序 "<< endl; 
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int interfacebase: :userchoice(void) 
{int menuchoice; 
cout <<" 请 输入 您 的 选择 :"; 
cin>> menuchoice; 


return menuchoice; 


} 

returninfo interfacebase: :processmenu( int menuchoice) 

{ 
int position, item, returnvalue; 
switch(menuchoice) // 根 据 用 户 的 选择 进行 相应 的 操作 
{ 


case 1:cout <<" 请 问 你 要 输入 数据 的 个 数 , 注意 要 在 "<< Maxsize <<" 个 以 内 :"; 
cin >> itenm; 
if(item> Maxsize) 
cout <<" 对 不 起 ,输入 数据 超 限 ,操作 已 取消 !"<< endl; 


else 
{ 
returnvalue = listonface. create( item); 
if(returnvalue == success) 
cout <<" 建 立 顺序 表 操 作成 功 ! "<< endl; 
} 
break; 
Case 2: 


returnvalue = listonface. traverse( ); 
if(returnvalue == underflow) 

cout <<" 顺 序 表 目 前 为 空 , 没有 数据 可 以 显示 !"<< endl; 
else 
cout <<" 顺 序 表 遍 历 操作 成 功 !"<< endl; 
break; 

Case 3: 
cout <<" 请 输入 要 修改 数据 的 位 置 :"; 
cin >> position; 
cout <<" 请 输入 要 修改 的 新 数据 : "; 
cin>> item; 

returnvalue = listonface. replace( position, item); 
if(returnvalue == underflow) 

cout <<" 对 不 起 ,顺序 表 已 空 ! "<< endl; 


else if(returnvalue == range_error) 


cout <<" 对 不 起 ,修改 的 位 置 超出 了 << endl; 
else 
cout <<" 修 改 操作 成 功 ! "<< endl; 
break; 
case 4: 


cout <<" 请 输入 要 插入 数据 的 位 置 :"; 
cin>> position; 
cout <<" 请 输入 要 插入 的 新 数据 :"; 
cin>> itenm; 
returnvalue = listonface. insert(position, item); 
if(returnvalue == overflow) 


cout <<" 对 不 起 ,顺序 表 溢 出 ,无 法 插入 新 数据 !"<< endl; 


else if(returnvalue == range error) 
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cout <<" 对 不 起 ,插入 的 位 置 超出 了 范围 !1"<< endl， 
else 
cout <<" 插 入 操作 成 功 ! "<< endl; 
break; 
Case 5: 
cout <<" 请 输入 要 删除 数据 的 位 置 : "; 
cin>> position; 
returnvalue = listonface. remove(position); 
if(returnvalue == underflow) 
cout <<" 对 不 起 ,顺序 表 已 空 !"<< endl; 
else if(returnvalue == range_error) 
cout <<" 对 不 起 ,删除 的 位 置 超出 了 范围 ! "<< endl; 
else 
cout <<" 删 除 操作 成 功 !"<< endl; 
break; 
Case 6: 
cout <<" 请 输入 要 读 取 数据 的 位 置 :"; 
cin>> position; 
returnvalue = listonface. get (position, item); 
if(returnvalue == underflow) 
cout <<" 对 不 起 ,顺序 表 已 空 ! "<< endl; 
else if(returnvalue == range_error) 
cout <<" 对 不 起 , 读 取 的 位 置 超出 了 范围 !1"<< endl; 
else 
cout <<" 读 取 的 数据 为 : "<< item << endl <<" 读 取 操 作成 功 !"<< endl; 
break; 
case 7: 
cout <<" 顺 序 表 目 前 的 长 度 为 : "<< listonface. length( )<< endl; 
cout <<" 求 顺序 表 长 度 操作 成 功 !"<< endl; 
break; 
case 8: 
returnvalue = listonface. invertlist(); 
if(returnvalue == underflow) 
cout <<" 对 不 起 ,顺序 表 已 空 !"<< endl; 
else 
cout <<" 顺 序 表 所 有 元 素 反 转 操作 成 功 ! "<< endl; 
break; 
Case 9: 
exit(0); 
default: 
cout <<" 对 不 起 , 您 输入 的 功能 编号 有 错 ! 请 重新 输入 ! !!1"<< endl; 
break; 
} 
return success; 
} 
// 下 面 为 本 程序 主人 口 main 函数 
void main(void) // 程 序 主 入 口 
| 
System("color £0"); 
SetConsoleTitle(" 顺 序 表 基 本 功能 展示 "); // 设 置 标题 栏 


int menuchoice; 
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interfacebase interfacenow; // 定 义 本 次 具体 的 界面 对 象 
seqlist seqlistnow; // 定 义 本 次 具体 的 线性 表 对 象 
interfacenow. clearscreen( ); // 清 屏 
while (1) // 永 真 循环 
{ 
interfacenow. showmenu( ); // 显 示 菜 单 
menuchoice = interfacenow. userchoice( ); // 读 取 用 户 响 应 
interfacenow. processmenu(menuchoice); // 处 理 用 户 响 应 
system("pause" ); // 暂 停 
interfacenow. clearscreen( ); // 清 屏 
} 
// 主 函数 结束 


时 间 效 率 评价 : 真正 插入 数据 的 操作 实际 上 只 有 一 个 赋值 语句 ,这 是 一 个 O(1) 级 别 的 
操作 ,但 是 由 于 引发 了 数据 的 移动 ,而 这 种 移动 必须 通过 循环 语句 来 实现 , 变 成 了 一 个 OCn) 
级 别 的 操作 ,导致 插入 算法 的 时 间 效 率 大 大 降低 ,在 海量 数据 的 前 提 下 ,这 种 动态 操作 体现 
了 顺序 表 的 缺点 。 注 意 在 最 好 的 情况 下 是 不 需要 移动 数据 的 ,最 坏 的 情况 下 却 需 要 移动 全 
部 数据 ,进行 时 间 效 率 分 析 时 ,可 以 取 平 均值 ,也 就 是 n/2, 按 照 系数 可 以 忽略 的 约定 ,所 以 
该 算法 的 时 间 效 率 为 OCn) 。 

在 删除 操作 中 ,并 没有 任何 涉及 删除 数据 的 语句 , 即 实际 删除 的 时 间 复 杂 度 为 0, 但 是 
由 于 要 移动 数据 ,启用 了 循环 ,就 演变 成 了 OCn) 级 别 的 操作 ,所 以 删除 算法 的 时 间 效率 也 
很 低 。 

读 取 数据 ,判断 是 否 为 空 . 求 表 长 .修改 数据 等 操作 的 时 间 复 杂 度 为 0(1), 时 间 效 率 
较 高 。 

线性 表 顺 序 存 储 的 优点 是 可 以 做 到 * 随 机 访问 ”, 也 就 是 访问 任何 数据 的 时 间 是 一 致 的 ， 
缺点 是 搬入、 删除 等 动态 操作 引起 了 数据 移动 ,时间 效率 低下 。 


2.4 线性 表 的 链接 存储 


线性 表 虽 然 可 以 用 较 容 易 理 解 的 顺序 存储 来 实现 ,但 是 由 于 它 用 物理 上 的 相 邻 单元 实 
现 逻 辑 上 的 相 邻 关系 ,所 以 一 旦 对 顺序 表 进 行 插入 、 删 除 操作 ,就 可 能 产生 数据 移动 ,导致 时 
间 效 率 下 降 。 为 了 解决 这 个 问题 ,必须 打破 数据 依次 相 邻 单元 存放 的 基本 约定 。C++ 中 的 
链表 提供 了 这 样 的 机 制 。 实 际 上 链表 恰恰 就 是 计算 机 科学 家 当初 为 了 解决 顺序 存储 引发 的 
数据 移动 问题 而 推出 的 。 

下 面 用 几 个 示意 图 的 演变 来 展示 单 链 表 是 如 何 工作 的 。 

在 图 2-4 中 ,约定 有 4 个 字母 逻辑 上 按照 英文 字母 序 顺序 排列 ( 即 A,B,C,D) ,存储 时 
并 没有 依次 放 在 一 起 。 此 时 数据 进入 了 内 存 , 但 是 数据 之 间 的 关系 却 没有 存储 ,如 找 不 到 哪 
一 个 是 逻辑 上 的 第 一 个 ,也 不 知道 某 一 个 数据 的 下 一 个 是 哪 一 个 ,也 不 知道 哪 一 个 是 最 后 一 
个 ,甚至 由 于 内 存 中 每 个 地 址 都 有 数据 的 特性 ,也 分 不 清楚 哪些 是 这 个 逻辑 结构 中 的 数据 ， 
哪些 不 是 。 

如 果 要 保存 逻辑 上 的 关系 ,就 必须 记录 人 逻 辑 上 下 一 个 数据 的 存储 地 址 。 为 此 用 两 种 不 


31 


用 C++ 实现 数据 结构 程序 设计 


headp [ 1030 
人 
A 
1026 
1027| B | 1031 
B 
| 本 
1029 cl 
1030| A | 1027 vy neadp 半 AT HBT cl -DT 和 
1031| C |1024 D | 和 人 
(@) 带 地 址 编号 (b) (不 带 地 址 纵向 (9 (不 带 地 址 ) 模 向 


2-4 指针 和 链表 效果 示意 图 


同类 型 的 数据 结合 在 一 起 做 成 一 个 结 点 ,第 一 部 分 为 数据 域 ,命名 为 data, 另 一 部 分 为 地 址 
域 ,命名 为 next, 这 两 部 分 的 整合 在 C 语言 中 用 结构 体 struct ,在 C++ 中 则 启用 对 象 class。 

在 图 2-4(a) 中 ,用 模拟 的 地 址 表示 ,实际 上 编程 实现 并 不 依赖 存储 地 址 的 编号 ,可 以 改 
用 指针 指向 下 一 个 地 址 来 代表 存储 下 一 个 数据 的 地 址 (图 中 结 点 的 边界 都 可 以 理解 为 它 的 
地 址 编号 ,指向 边界 的 任何 一 处 都 是 一 样 的 )。 图 2-4(c) 改 为 横向 画 法 ,这 是 最 常用 的 链表 
示意 图 画 法 。 

当 把 多 个 数据 通过 这 种 机 制 挂 在 一 起 时 ,n 个 元 素 的 线性 表 组 成 了 一 个 链 状 的 结构 , 称 
为 “链表 ”。 由 于 每 个 结 点 只 有 一 个 指向 其 直接 后 继 的 指针 ,所 以 称 其 为 “ 单 链表 ”。 

部 分 读者 对 于 链表 示意 图 的 工作 原理 或 者 程序 设计 感到 很 难 理解 ,实际 上 在 现实 生活 
中 这 种 机 制 是 经 常 能 遇 到 的 。 例 如 在 大 学 里 ,课程 “数据 结构 ?在 某 个 时 刻 应 该 在 1216 室 上 
课 , 由 于 多 媒体 设备 出 现 了 问题 ,这 时 老师 在 黑板 或 门 上 留 下 一 张 纸 条 :“ 上 “数据 结构 "的 
学 生 请 到 2301 室 去 上 课 ”。 这 种 情况 下 ,所 有 来 上 课 的 学 生 先 到 达 1216 室 , 之 后 根据 提示 
的 教室 号 赶 往 2301 室 。 这 实际 就 是 一 种 链表 思想 的 实际 运用 。 

除 此 之 外 ,有 些 公路 上 的 方向 指示 标记 ,有 些 商 场 在 地 上 贴 的 指引 图 标 都 是 这 样 的 例 
子 。 有 些 电视 节目 中 组 织 的 活动 是 一 种 连续 分 阶段 执行 的 任务 ,只 有 在 完成 上 一 个 任务 后 
才 会 获得 下 一 个 任务 的 指令 也 是 链表 机 制 的 体现 。 

链表 由 一 个 个 结 点 构成 ,C 语言 中 结 点 可 以 通过 结构 体 递归 定义 而 成 ,语句 如 下 : 


struct node // 结 点 结构 体 
{ 
int data; // 数 据 域 
node * next; // 指 针 域 
}; 
结 点 在 C++ 语言 中 通过 对 象 定义 如 下 : 
class node // 结 点 对 象 定义 
{ 
public: 
int data; // 数 据 域 
node * next; // 指 针 域 


}; 
对 于 链表 的 访问 ,必须 给 出 一 个 人 口 。 这 就 是 第 一 个 结 点 的 地 址 。 启 用 一 个 “ 头 指针 ” 
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(head pointer, 简 记 为 headp) 来 达到 这 个 目的 。 实 际 上 就 是 一 个 变量 ,用 来 存储 整个 链表 的 
第 一 个 结 点 的 地 址 。 在 向 操作 系统 申请 空间 时 都 会 启用 一 个 变量 名 ,那么 直接 用 该 变量 名 
管理 即 可 。 

C 语言 中 定义 头 指针 变量 的 语句 为 : 

struct node * headp; // 全 局 变量 ,定义 了 头 指针 

在 C++ 语言 中 链表 将 作为 另外 一 个 对 象 进行 定义 ,其 中 定义 头 指针 变量 的 语句 为 : 


private: 


node * headp; 


对 于 链表 来 说 ,增加 数据 就 是 先 申请 一 个 结 点 ,然后 放 入 数据 ,再 进行 挂 链 操作 。 
在 C 语 言 中 申请 一 个 结 点 的 语句 为 : 


# define len sizeof(struct node) // 结 构 体 node 的 长 度 , 即 要 申请 空间 的 
// 长 度 
headp = (struct node * )malloc(len); // 申 请 头 结 点 空间 


在 C++ 语言 中 使 用 类 似 headp 一 new node; 的 语句 来 申请 新 结 点 ,作为 头 结 点 。 

通常 单 链 表 的 最 后 一 个 结 点 没有 后 继 , 其 指针 域 置 空 , 图 中 是 一 个 小 尖 尖 ,编程 中 为 
NULL, 表 明 此 线性 表 到 此 结束 。 通 常 申请 成 功 一 个 新 的 结 点 时 ,应 该 把 这 个 结 点 的 指针 域 
定义 为 空 ,以 避免 链表 地 址 管理 的 意外 。 其 语句 写 为 : 


headp — > next = NULL; 


在 链表 结构 中 通常 是 从 第 一 个 结 点 的 地 址 开始 依次 访问 后 面 的 每 一 个 结 点 ,这 种 访问 
特性 被 称 为 “顺序 访问 ”, 而 不 再 有 顺序 存储 时 的 “随机 访问 ”特性 。 

为 了 达成 对 所 有 数据 的 访问 ,通常 会 启用 一 个 专用 的 搜索 指针 (search pointer ,简称 为 
searchp) ,初始 状态 从 头 指 针 的 地 址 开始 ,其 语句 写 为 : 


searchp = headp; 


之 后 需要 控制 这 个 指针 依次 向 后 移动 ,把 当前 searchp 指向 的 结 点 的 next 域 赋值 给 
searchp 即 可 ,其 语句 为 “searchp 二 searchp-> next;”, 这 个 语句 在 链表 程序 设计 中 ,非常 基本 
且 非 常 重要 ,属于 很 常用 的 语句 。 

编程 时 搜索 指针 从 链表 头 部 到 尾部 的 移动 过 程 通过 循环 结构 来 控制 。 一 般 情况 下 不 要 
移动 头 指针 headp ,一 旦 用 它 进行 遍历 ,就 会 造成 大 量 数据 丢失 。 

在 链表 程序 设计 中 ,由 于 可 能 把 全 部 数据 删 光 而 导致 “链表 为 空 ”, 这 时 可 能 给 后 续 设 计 
带 来 麻烦 。 如 在 链表 中 插入 结 点 ,将 结 点 插 在 第 一 个 位 置 和 其 他 位 置 是 不 同 的 ,在 链表 中 删 
除 结 点 时 ,删除 第 一 个 结 点 和 其 他 结 点 的 处 理 也 不 同 。 这 种 情况 处 理 不 好 就 会 使 得 程序 出 
现 不 可 预料 的 情况 。 为 了 增加 程序 的 健壮 性 和 简化 设计 ,建议 增加 一 个 空置 的 “ 头 结 点 ”, 实 
际 上 就 是 浪费 掉 一 个 结 点 ,headp 中 存放 着 头 结 点 的 地 址 ,这 样 即使 是 空 表 , 头 指针 headp 
也 不 为 空 。 头 结 点 的 使 用 使 得 “ 非 空 表 ” 和 *“ 空 表 ” 的 差异 不 再 存在 ,操作 变 得 一 致 。C 语言 
中 建议 编制 一 个 初始 化 (initialization) 的 函数 来 做 这 项 工作 ,而 在 C++ 中 可 以 用 对 象 的 构造 
函数 来 做 这 项 工作 。 
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作为 程序 设计 技巧 ,在 处 理 的 数据 类 型 为 整数 的 情况 下 , 头 结 点 的 数据 域 也 可 以 被 利 
用 ,如 存储 数据 个 数 。 

图 2-5 是 使 用 单 链表 存储 有 3 个 数据 的 线性 表 的 示意 图 ,分 别 是 无 头 结 点 和 有 头 结 点 
的 范例 。 
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searchp searchp 
图 2-5 线性 表 用 单 链表 存储 的 示意 图 


链表 中 结 点 空间 在 删除 结 点 后 ,一定 要 释放 该 空间 ,还 给 操作 系统 管理 ,否则 就 会 形成 
所 谓 的 “内 存 垃圾 ”， 大 量 的 内 存 垃 声 将 导致 内 存 很 快 丰 尽 ， 从 而 引发 死机 。 

释放 空间 在 C 语言 中 的 语句 为 “free (searchp);”, 而 在 C++ 语言 中 , 则 为 “delete 
searchp;”。 

由 于 链表 的 特性 ,如 果 要 在 链表 的 中 间 插 入 一 个 数据 ,只 需要 修改 一 些 相 关 链 表 的 指针 
即 可 以 实现 ,而 不 再 需要 进行 大 量 数据 的 移动 。 但 是 寻找 该 位 置 的 操作 却 必须 使 用 “顺序 访 
问 ?的 方法 ,访问 数据 的 速度 和 数据 量 有 关 , 越 往 后 的 数据 被 访问 需要 的 时 间 越 长 ,时 间 效 率 
有 所 下 降 。 

在 链表 上 完成 插入 操作 通过 以 下 步骤 进行 : 

(1) 申请 新 结 点 ,把 要 插入 的 数据 存 人 该 结 点 的 数据 域 , 把 链 域 置 为 空 (NULL)。 

(2) 启用 搜索 指针 searchp 找到 正确 位 置 。 

(3) 改动 相应 的 指针 ,将 新 结 点 挂 人 正确 的 位 置 。 

通常 在 某 一 个 结 点 的 直接 后 继 的 位 置 插入 比较 方便 。 

设 searchp 指向 单 链表 中 某 结 点 ,newnode 指向 待 插入 值 为 value 的 新 结 点 ,搬入 操作 
示意 图 如 图 2-6 所 示 。 操 作 如 下 : 

人 newnode-> next 一 searchp-> next; 

©@ searchp-> next=newnode; 


注意 : 这 两 个 操作 有 次 序 相 关 性 ,不 能 交换 ,否则 会 导致 大 量 数据 的 丢失 。 


newnode 
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2-6 单 链表 中 进行 插入 操作 的 示意 图 


如 果 要 插入 在 某 一 个 结 点 的 直接 前 趋 的 位 置 .那么 就 要 通过 其 他 的 方法 , 几 种 常用 的 方 
法 如 下 : 

(1) 修改 判断 的 条 件 为 searchp-> next-> data 是 否 等 于 某 个 值 , 使 得 搜索 指针 提前 停 一 
个 位 置 ,这 种 方法 属于 技巧 性 的 ,并 不 是 很 好 ,因为 移动 到 最 后 一 个 结 点 就 会 出 错 。 

(2) 将 新 的 结 点 插入 到 searchp 的 后 面 ,然后 将 这 两 个 结 点 的 数据 域 的 值 进行 交换 。 这 
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种 编程 方法 也 属于 技巧 性 的 。 

(3) 启用 一 个 “尾随 指针 ”(follow pointer, 简 记 为 followp) ,在 searchp 移动 直到 找到 某 
个 数据 位 置 的 过 程 中 ,后 面 始终 跟随 着 followp, 这 个 思路 比较 专业 。 

对 于 删除 ,也 只 需要 通过 改 链 就 可 以 完成 。 不 过 在 单 链表 中 , 当 一 个 指针 指向 某 一 个 结 
点 时 ,是 不 能 删除 它 自身 的 ,因为 它 的 地 址 存放 在 直接 前 趋 结 点 的 链 域 中 ,所 以 有 必要 继续 
启用 尾随 指针 。 

在 链表 上 完成 插入 操作 通过 以 下 步骤 进行 : 

(1) 使 用 搜索 指针 searchp 找到 相应 的 位 置 ,同时 启用 尾随 指针 followp。 

(2) 改 链 。 

(3) 释放 删除 的 结 点 空间 ,回归 操作 系统 管理 。 

设 searchp 指向 单 链 表 中 某 结 点 ,followp 指向 它 的 直接 前 趋 ,删除 操作 示意 图 如 图 2-7 
所 示 。 具 体 语句 如 下 : 

© followp-> next= searchp-> next; 

©@ free(Csearchp) ; 

注意 : 这 两 个 操作 有 次 序 相关 性 ,不 能 交换 ,否则 会 出 错 。 
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图 2-7 单 链 表 存储 删除 操作 的 示意 图 
【程序 源码 2-2】 下 面 为 链表 实现 线性 表 基 本 功能 的 部 分 程序 源码 。 


// 功 能 : 单 链表 实现 线性 表 的 基本 功能 

// 完 成 单 链表 的 新 建 . 显 示 、 插 人、 删除 . 读 取 、 修 改 、 反 转 等 功能 

# include < iostream.h> 

# include < windows.h> 

const MAXNUMOFBASE = 5; // 基 础 数据 总 量 

enum returninfo{ success, fail, overflow, underflow, range_error}; // 定 义 返回 信息 清单 
// 本 程序 的 基础 数据 采用 内 置 法 , 直接 放 入 数组 


> 


int sourcedata[ MAXNUMOFBASE] = {11, 22, 33, 55, 66, }; // 内 部 数据 数组 
class node // 结 点 的 对 象 设计 
{ 
public: 

int data; // 数 据 域 

node * next; // 结 点 指针 
本 
class linklist // 链 表 的 对 象 设计 
{ 
private: 

node * headp; 
protected: 

int count; // 计 数 器 ,统计 结 点 个 数 , 即 线性 表 的 长 度 
public: 

linklist(); // 构 造 函 数 
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一 linklist(); 
returninfo create(void); 
void clearlist(void); 
bool empty(void) const; 
int length(void) const; 
returninfo traverse(void); 
returninfo retrieve( int position, int &item) const; 
returninfo replace( int position, const int &item); 
returninfo insert( int position, const int &item); 
returninfo remove( int position); 
returninfo invertlist(void); 
}; 
linklist::linklist() 
{ 
headp = new node; 
headp -> next = NULL; 
count = 0; 
上 
linklist::~linklist() 
{ 
clearlist(); 
delete headp; 
count = 0; 
returninfo linklist: :create(void) 
{ 
node * searchp = headp, * newnodep; 
int i; 
for (i=0;i<MAXNUMOFBASE;i++) 
{ 
newnodep = new node; 
newnodep - > data = sourcedata[ i]; 
newnodep — > next = NULL; 
searchp — > next = newnodep; 
Searchp = searchp 一 > next; 
Count++; 
Y 
searchp — > next = NULL; 
traverse( ); 
return success; 
} 
void linklist: :clearlist(void) 
{ 
node * Searchp = headp — > next, * followp = headp; 
while( searchp!= NULL) 
{ 
followp = searchp; 
Searchp = Searchp 一 > next; 
delete followp; 


// 析 构 函 数 

// 链 表 的 初始 化 
// 清 空 链表 

// 判 断 是 否 空 链 
// 求 链表 的 长 度 
// 遍 历 链 表 所 有 元 素 
// 读 取 一 个 结 点 
// 修 改 一 个 结 点 
// 插 入 一 个 结 点 
// 删 除 一 个 结 点 
// 链 表 所 有 数据 反 转 


// 构 造 函 数 


// 申 请 新 结 点 ,作为 头 结 点 
// 头 结 点 的 地 址 域 预 设 为 空地 址 
// 计 数 器 清 零 , 表明 开始 时 没有 实际 数据 


// 析 构 函 数 


// 删 除 所 有 数据 ,释放 所 有 结 点 
// 把 头 结 点 也 释放 掉 
// 计 数 器 清 零 ,表明 开始 时 没有 实际 数据 


// 此 处 对 于 申请 失败 并 没有 处 理 

// 结 点 数据 域 赋值 

// 把 结 点 后 面 的 链 域 置 空 

// 把 新 结 点 挂 链 ,尾部 插入 法 

// 移 动 结 点 的 指针 ,保证 下 次 正确 插入 
// 数 据 量 的 计数 器 加 1 


// 最 后 处 理 一 次 链 域 为 空 
// 遍 历 一 次 

// 返 回 成 功 标志 

// 清 空 链表 

// 初 始 化 两 个 指针 

// 尾 随 指针 跟 上 来 


// 搜 索 指针 前 进 
// 释 放 掉 尾 随 指 针 指 向 的 结 点 空间 


headp -> next = NULL; 


count = 0; 
: 
returninfo linklist: :traverse(void) 
{ 
node * searchp; 
if(empty()) 
return underflow; 
searchp = headp — > next; 
cout <<" 链 表 中 的 全 部 数据 为 : Headp ->"; 
whilel( searchp!= NULL) 
| 
cout <<"[ "<< searchp -> data; 
if (searchp— > next == NULL) 
cout <<" |^]"; 
else 
cout <<" |- ] ->"; 
Searchp = searchp 一 > next; 
' 
cout << endl; 
return success; 


} 
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// 保 留 了 最 后 一 个 结 点 ,就 是 头 结 点 ,并 
// 且 链 域 置 为 空 
// 计 数 器 也 清 零 


// 遍 历 链 表 中 的 所 有 元 素 


// 启 用 搜索 指针 


// 空 表 的 处 理 


// 提 示 显 示 数 据 开 始 
// 循 环 显示 所 有 数据 


// 显 示 结 点 的 技巧 


// 显 示 最 后 一 个 结 点 


// 显 示 中 间 的 结 点 


// 最 后 有 一 个 回 车 
// 返 回 成 功 标 志 


returninfo linklist: :retrieve( int position，int &item) const // 读 取 一 个 结 点 


{ 

if(empty()) 
return underflow; 

if(position<=0||position>= count + 1) 
return range_error; 

node * Searchp = headp — > next; 

for(int i=1; i<position && searchp!= NULL; i++) 
searchp = searchp — > next; 


item = searchp — > data; 
return success; 
returninfo linklist: :replace( int position, const int &item) 
{ 
if(empty()) 
return underflow; 
if(position<= 0||position>= count + 1) 
return range error; 
node * searchp = headp 一 > next; 
for(int i=1; i<position && searchp!= NULL; i++) 
Searchp = Searchp 一 > next; 
Searchp 一 > data = item; 
return success; 
} 
returninfo linklist: :insert( int position, const int &item) 
{ 
if(position<=0 || position>= count + 2) 
return range error; 


// 空 表意 外 处 理 


// 位 置 有 错 意 外 处 理 


// 定 义 搜索 指针 ,初始 化 
// 提 示 : 注意 小 于 号 
// 顺 序 访问 方式 ,用 循环 ,算法 复杂 度 是 


//0(n) 


// 返 回 读 取 的 数据 
// 本 次 操作 成 功 


// 修 改 一 个 结 点 


// 实 际 修改 数据 的 语句 


// 插 入 一 个 结 点 
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node * newnodep = new node, * Searchp = headp 一 > next, * followp = headp; 
for(int i=1; i<position && searchp!= NULL; i++ ) 
{ 

followp = searchp; 

Searchp = searchp 一 > next; 


} 
newnodep — > data = item; // 给 数据 赋值 
newnodep — > next = followp 一 > next; // 注 意 此 处 的 次 序 相关 性 
followp - > next = newnodep; 
count++; // 计 数 器 加 1 
return success; 
} 
returninfo linklist: :remove( int position) // 删 除 一 个 结 点 
{ 
if(empty()) 
return underflow; 
if(position<= 0||position>= count+ 1) 
return range_error; 
node # searchp = headp - > next, * followp = headp;  // 这 里 两 个 指针 的 初始 值 设计 一 前 一 后 
for(int i=1; i<position && searchp!= NULL; i++) 
{ 
followp = searchp; 
Searchp = searchp - > next; 
followp - > next = searchp 一 > next; // 删 除 结 点 的 实际 语句 
delete searchp; // 释 放 该 结 点 
count ——; // 计 数 器 减 1 
return success; 
} 
returninfo linklist::invertlist(void) // 链 表 所 有 数据 反 转 
. 
node * nowp, * midp, * lastp; // 启 用 多 个 辅助 指针 
if(empty()) 


return underflow; 
nowp = headp — > next; 
midp = NULL; 
while(nowp!= NULL) 
{ 

lastp = midp; 

midp = nowp; 

nowp = nowp 一 > next; 

midp—> next = lastp; 
} 
headp — > next = midp; 
return success; 


. 


图 2-8 为 单 链表 功能 展示 程序 运行 后 的 部 分 界面 。 
时 间 效 率 评价 : 由 于 插入 数据 和 删除 数据 操作 只 需要 修改 指针 ,所 以 这 些 操作 都 是 


O() 级 别 的 时 间 复 杂 度 ,但 是 读 取 数 据 必须 通过 循环 语句 来 实现 ,这 一 部 分 是 O(n) 级 别 的 
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时 间 复 杂 度 ,导致 算法 时 间 效 率 有 所 下 降 。 

判断 是 否 为 空 , 求 表 长 等 操作 的 时 间 复 杂 度 为 0(1) ,时 间 效 率 较 高 。 由 于 清空 链表 、 遍 
历数 据 ` 读 取 数 据 、 修 改 数据 .数据 反 转 等 操作 都 启用 了 循环 机 制 ,都 是 O(n) 级 别 的 时 间 复 
杂 度 。 


链表 的 优点 是 可 以 做 到 高 效 的 动态 操作 ,插入 、 删 除 等 操作 不 会 引起 数据 的 移动 ,但 是 


:1 


六 Headp-> [ 11 4-]->[ 22 1-]->[5 33 1-]->[ 55 1-]->t 66 1^1 
日 


图 2-8 单 链 表 功 能 展示 程序 运行 后 的 部 分 界面 


2.5 线性 表 链 接 存储 的 变形 


对 于 单 链表 而 言 ,最 后 一 个 结 点 的 指针 域 指向 的 是 * 空 ”, 在 启用 搜索 指针 时 ,通常 从 头 
部 找到 尾部 ,一 旦 结束 该 指针 就 变 成 空地 址 ,这 正好 是 循环 控制 搜索 指针 时 用 的 结束 条 件 。 
如 果 要 重新 查找 , 则 必须 从 头 部 开始 再 重 设 搜索 指针 。 为 了 不 使 搜索 指针 为 空地 址 ,可 以 利 
用 最 后 一 个 指针 域 ,使 之 指向 链表 的 头 部 ,这 样 就 巧妙 地 把 链表 做 成 了 一 个 环 状 的 结构 。 它 
的 好 处 是 搜索 指针 一 旦 启用 ,就 可 以 在 链表 中 永远 存在 。 为 了 保证 循环 链表 的 环 状 一 直 存 
在 而 简化 程序 设计 时 的 意外 处 理 , 建 议 启用 一 个 头 结 点 。 

图 2-9 是 有 3 个 数据 的 线性 表 使 用 循环 链表 存储 的 示意 图 ,可 以 看 到 空 线 性 表 保 持 了 
基本 的 环 状 。 


heap E20 oe 了 和 | F222 T PI 333 由 


searchp 


空 循环 链表 有 数据 的 循环 链表 


2-9 循环 链表 的 原理 示意 图 


在 单 循环 链表 上 的 编程 基本 上 与 非 循 环 链表 相同 ,只 是 将 原来 判断 指针 是 否 为 NULL 
变 为 是 否 指 向 头 指针 ,没有 更 多 的 变化 。 因 为 该 链表 是 带 有 头 结 点 的 结构 ,所 以 搜索 指针 的 
初始 状态 指向 第 一 个 实际 数据 (searchp 王 headp-> next) ,而 不 是 头 指针 所 指 的 结 点 ,这 样 在 
判断 是 否 已 经 查找 一 轮 时 ,可 以 把 条 件 区 别 开 来 ( 即 经 过 一 轮 搜索 后 的 结束 条 件 是 searchp 
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一 一 headp) 。 

在 单 链表 的 结 点 中 只 有 一 个 指向 其 后 继 结 点 的 指针 域 next, 若 希望 能 访问 该 结 点 的 直 
接 前 趋 就 不 方便 。 解 决 方法 之 一 就 是 用 循环 链表 从 该 结 点 再 转 一 圈 , 那 么 必须 启用 循环 机 
制 ,访问 直接 后 继 操作 的 时 间 效 率 是 O(1) ,而 访问 直接 前 趋 操作 的 时 间 效 率 却 是 O(n) ,如 
果 一 个 应 用 对 于 一 个 数据 的 直接 后 继 和 直接 前 趋 一 样 重要 , 且 经 常会 交替 访问 ,那么 这 个 问 
题 就 比较 突出 。 为 此 可 以 再 启用 一 个 链 域 ,用 来 指向 直接 前 趋 ,这 样 双向 访问 的 问题 就 解决 
了 ,而 且 访问 的 时 间 效 率 都 是 O(1) ,但 是 必须 付出 一 些 空间 的 代价 。 用 这 种 结 点 组 成 的 链 
表 称 为 双向 链表 。 当 然 , 也 可 以 设计 出 双向 循环 链表 ,建议 带 一 个 头 结 点 。 

图 2-10 是 有 3 个 数据 的 线性 表 使 用 双向 循环 链表 存储 的 示意 图 。 指 向 直接 后 继 的 指 
针 继 续 使 用 next, 而 增加 一 个 指向 直接 前 趋 的 指针 prior。 


searchp | 
| 
head head vi 222 333 
eat BA ip ys DE NE EN 
图 2-10 双向 循环 链表 的 原理 示意 图 


由 于 有 了 两 个 方向 的 指针 ,在 编程 中 ,尤其 是 动态 操作 时 必须 注意 到 这 两 个 指针 都 要 处 
理 。 其 他 的 程序 设计 细节 与 单 循环 链表 上 的 操作 基本 上 相同 。 

有 趣 的 是 ,在 单 链表 中 无 法 删除 一 个 搜索 指针 正在 指向 的 结 点 ,但 是 在 双向 链表 中 , 却 
可 以 做 到 ,不 过 需要 把 搜索 指针 处 理 好 。 为 了 突出 难点 和 重点 ,下 面 的 源码 主要 给 出 了 构 
建 .遍历 .插入 和 删除 4 种 主要 功能 。 

【程序 源码 2-3】 双向 循环 链表 部 分 主要 功能 源码 。 


struct dlnode // 结 点 的 设计 
{ 
int data; // 数 据 域 
dlnode * prior; // 指 向 直接 前 趋 的 指针 
dlnode * next; // 指 向 直接 后 继 的 指针 
}; 
class dllinklist // 链 表 的 对 象 设计 
{ 
private: 
dlnode * headp; 
protected: 
int count; // 计 数 器 ,统计 结 点 个 数 , 即 线性 表 的 长 度 
public: 
dllinklist(); // 构 造 函 数 
~dllinklist(); // 析 构 函 数 
returninfo create( ); // 链 表 的 初始 化 
void clearlist(); // 清 空 链 表 
bool empty() const; // 判 断 是 否 空 链 
int length() const; // 求 链表 的 长 度 
returninfo traverse(void); // 遍 历 链表 所 有 元 素 


returninfo retrieve( int position，int &item) const; // 读 取 一 个 结 点 
returninfo replace( int position, const int &item); // 修 改 一 个 结 点 


returninfo insert(int position, const int &item); 


returninfo remove( int position); 
returninfo invertlist(void); 
}; 
returninfo dllinklist: :create() 
{ 
dlnode *x searchp = headp; 
dlnode * newdlnodep; 
Ei 是 
证 (!empty()) 
return fail; 
for (i = 0; i< MAXNUMOFBASE; i++) 
{ 
newdlnodep = new dlnode; 
if (newdlnodep == NULL) 
return fail; 
newdlnodep—> data = sourcedata[i]; 
newdlnodep 一 > next = NULL; 
newdlnodep 一 > prior = NULL; 
Searchp -> next = newdlnodep; 
newdlnodep -> next = headp; 
newdlnodep -> prior = searchp; 
headp -> prior = newdlnodep; 
searchp = searchp— > next; 
Count++; 
} 
traverse( ); 
return success; 


} 
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// 插 入 一 个 结 点 
// 删 除 一 个 结 点 
// 链 表 所 有 数据 反 转 


// 处 理 申 请 内 存 错误 


// 结 点 数据 域 赋值 
// 把 结 点 后 面 的 链 域 置 空 


// 把 新 结 点 挂 链 ,尾部 插入 法 

// 尾 部 连 入 头 部 

// 指 向 前 一 个 结 点 

// 头 部 连 入 尾部 

// 移 动 结 点 的 指针 ,保证 下 次 正确 插入 
// 数 据 量 的 计数 器 加 1 


// 遍 历 一 次 
// 返 回 成 功 标 志 


// 在 输出 上 结 点 的 两 边 都 画 了 一 个 箭头 用 于 表示 双向 的 感觉 


returninfo dllinklist: :traverse() 
{ 
dlnode * searchp; 
Nba 
证 (empty()) 
return underflow; 
searchp = headp— > next; 
cout << "链表 中 的 全 部 数据 为 : Headp -> "; 


for (i = 0; i<count; i++) 


{ // 循 环 显示 所 有 数据 


cout << "<-[-|" << searchp— > data; 


if (searchp 一 > next == headp) 


cout << " |-]->Headp"; 
else 

cout <<" |-]->"; 
searchp = Searchp 一 > next; 
} 


cout << endl; 
return success; 


// 遍 历 链 表 中 的 所 有 元 素 


// 启 用 搜索 指针 


// 空 表 的 处 理 


// 提 示 显 示 数 据 开始 


// 显 示 结 点 的 技巧 


// 显 示 最 后 一 个 结 点 


// 显 示 中 间 的 结 点 


// 最 后 有 一 个 回 车 
// 返 回 成 功 标 志 
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returninfo dllinklist: :insert(int position, const int &item) // 插 入 一 个 结 点 
{ 
if (position <= 0 || position >= count + 2) 
return range_error; 
dlnode x* newdlnodep = new dlnode; 
dlnode * searchp = headp; 
for (int i = 0; i< position - 1 && searchp->next != headp; i++) // 因 为 是 循环 的 ,所 以 不 
// 用 searchp!= NULL 
searchp = searchp—> next; 
newdlnodep 一 > next = searchp 一 > next; // 真 正 的 插入 语句 开始 
searchp— > next -> prior = newdlnodep; 
searchp—> next = newdlnodep; 
newdlnodep—> prior = searchp; 
newdlnodep—> data = item; 


Count++; // 计 数 器 加 1 
return success; 


} 
returninfo dllinklist: :remove( int position) // 删 除 一 个 结 点 


{ 

if (empty()) 
return underflow; 

证 (position <= 0 || position >= count + 1) 
return range_error; 

dlnode * searchp = headp; 

for (int i = 0; i< position && searchp - > next != headp; i++) // 因 为 是 循环 的 ,所 以 不 用 

//searchp!= NULL 

searchp = Searchp 一 > next; 

searchp—> prior ->next = searchp 一 > next; // 真 正 的 删除 语句 开始 

Searchp -> next 一 > prior = searchp—> prior; 

delete searchp; 

count ——; 

return success; 


如 果 数 据 域 的 数据 类 型 是 整 型 ,那么 头 结 点 中 的 数据 域 可 以 存储 数据 个 数 。 


2.6 线性 表 存 储 结构 实现 的 选择 标准 


如 果 一 个 程序 处 理 了 一 批 线性 关系 的 数据 ,那么 这 批 数 据 就 确定 了 逮 辑 结构 为 线性 表 。 
进一步 ,在 编程 时 应 该 怎样 选取 存储 结构 呢 ? 通常 有 以 下 几 点 可 以 考虑 。 

1. 基于 存储 空间 的 考虑 

顺序 表 通 常 采 用 数组 ,如 果 存 储 空间 静态 分 配 ,在 使 用 之 前 必须 明确 定义 它 的 大 小 ,过 
大 造成 浪费 ,过 小 容易 溢出 。 如 果 对 线性 表 的 空间 大 小 难以 估计 时 则 不 宜 采 用 顺序 表 ; 而 
链表 不 用 事先 估计 存储 规模 ,只 是 在 需要 的 时 候 向 操作 系统 申请 ,用 完 之 后 归还 ,所 以 比较 
灵活 ,但 链表 的 存储 效率 较 低 ,需要 付出 更 大 的 存储 代价 。 

2. 基于 常用 操作 的 考虑 

在 顺序 表 中 按 序号 访问 ai 的 时 间 复 杂 度 为 0(1) ,链表 中 按 序号 访问 的 时 间 复 杂 度 为 
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O(n) ,如 果 多 数 时 间 要 按 序 号 访问 数据 元 素 ,显然 顺 序 表 优 于 链表 ; 在 顺序 表 中 进行 插入 、 
删除 操作 时 平均 移动 表 中 一 半 的 元 素 , 当 数据 元 素 较 多 时 ,时间 效 率 急剧 下 降 ; 在 链表 中 进 
行 插入 、 删 除 操作 ,虽然 也 要 寻找 插入 位 置 ,但 操作 主要 是 读 取 数据 和 比较 是 否 相等 ,插入 和 
删除 本 身 不 会 引起 数据 的 移动 ,从 这 个 角度 看 链表 的 总 体 速度 优 于 顺序 表 。 

3. 基于 开发 环境 的 考虑 

由 于 任何 高 级 语言 中 都 有 数组 类 型 ,顺序 表 容 易 实现 ,而 链表 的 操作 基于 指针 ,不 是 每 
一 种 高 级 语言 都 提供 这 种 机 制 。 相 对 来 讲 前 者 简单 些 ,通常 这 也 是 考虑 的 一 个 因素 。 

虽然 链表 提供 了 灵活 的 插入 \ 删 除 操作 机 制 ,但 是 并 不 是 每 一 种 高 级 语言 都 提供 指针 和 
链表 。 那 么 在 遇 到 这 种 高 级 语言 又 需要 启用 链表 机 制 时 ,一 种 实现 方案 就 是 利用 数组 来 模 
拟 指针 构成 的 链表 。 由 于 数组 空间 的 大 小 都 事先 定义 好 且 不 能 变化 ,所 以 简称 为 “ 静 

顺序 表 和 链表 这 两 种 存储 结构 各 有 优 缺 点 ,选择 哪 一 种 由 实际 问题 中 的 主要 因素 决定 。 
通常 “ 较 稳定 ”的 线性 表 宜 选择 顺序 存储 ,而 需要 频繁 进行 插入 删除 操作 的 即 动态 性 较 强 的 
线性 表 宜 选择 链接 存储 。 有 时 为 了 方便 操作 ,可 以 主要 使 用 一 种 存储 结构 ,然后 执行 某 种 操 
作 时 临时 启用 另外 一 种 存储 结构 。 

在 后 面 的 章节 中 还 会 看 到 把 不 同 的 存储 结构 整合 在 一 起 ,构成 更 复杂 存储 结构 的 范例 。 


2.7 线性 表 的 应 用 案例 


线性 表 作 为 数据 结构 ,其 主要 用 途 是 处 理 任何 线性 关系 的 数据 。 只 要 需要 ,在 一 个 程序 
中 可 以 使 用 多 组 线性 表 结 构 来 同时 处 理 多 批 线性 结构 的 数据 。 例 如 象棋 程序 设计 中 如 果 要 
把 棋子 信息 告知 系统 , 则 可 以 通过 线性 表 存 储 所 有 棋子 的 名 称 或 编号 ,以 供 进一步 使 用 。 从 
键盘 上 输入 数据 ,通常 也 都 是 按照 线性 关系 来 理解 的 。 

【应 用 案例 2-1】 两 个 长 位 数 正 整数 相 加 的 程序 设计 。 

由 于 高 级 语言 中 对 整数 会 限制 最 大 值 ,这 样 在 计算 很 大 的 整数 加 法 时 会 出 现 溢 出 问题 。 
如 果 改 为 浮 点 数 ,那么 就 会 出 现 最 后 的 n 位 数 不 完 全 准确 。 为 了 能 计算 非常 大 的 正 整数 之 
间 的 加 法 ,如 100 位 长 ,只 能 采用 特殊 的 数据 结构 来 解决 。 首 先 根据 整数 的 线性 特征 和 逻辑 
结构 选择 线性 表 。 其 次 由 于 在 相 加 的 过 程 中 可 能 产生 进位 的 问题 ,明显 不 适用 链表 , 故 采用 
顺序 表 来 表示 整数 。 为 了 方便 处 理 ,在 键盘 输入 过 程 中 要 注意 整数 的 数据 本 身 所 有 内 容 之 
间 需 要 加 空格 ,也 就 是 变 成 了 所 谓 的 字符 串 。 算 法 方面 需要 从 整数 的 低位 开始 运算 ,逐步 运 
算 到 最 高 位 ,最 后 可 以 把 结果 也 放 在 一 个 顺序 表 中 。 

【应 用 案例 2-2〗 多 项 式 的 加 减法 操作 。 

多 项 式 (polynomial) 通 常 表示 为 pa 一 ax 十 azx" 十 … 十 asx 十 c。 

比较 规范 的 范例 如 : pa 二 23x’ 一 28x 十 89x? 十 67x? 一 33x 十 58, 其 特征 为 从 某 个 方 震 开 
始 ,降序 排列 ,中间 的 所 有 项 都 存在 。 

比较 不 规范 的 范例 如 : pb 二 3x””" 一 2x'5 一 7x3* 十 5x*” 十 58, 其 特征 为 方 备 之 间 不 连续 ， 
间隔 可 以 相当 巨大 ,从 程序 设计 的 通用 性 角度 ,可 以 还 有 一 些 方 究 相 同 的 项 , 方 窜 的 次 序 也 
不 一 定 非 要 降序 排列 ,可 能 是 乱 序 排列 。 

如 果 是 仅 计算 多 项 式 的 值 ,通常 采用 和 迭 代 法 来 完成 。 如 果 要 求 把 两 个 多 项 式 进行 加 减 
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法 运算 , 则 必须 进一步 讨论 存储 结构 和 算法 。 

首先 ,选择 数据 结构 。 由 于 多 项 式 通 常 根据 方 血 从 大 到 小 按照 一 维 线性 关系 排列 ,所 以 
选择 线性 表 是 合适 的 选择 。 

其 次 ,选择 存储 结构 。 先 考虑 一 下 顺序 表 , 如 果 利 用 方 寡 逐次 降低 的 特点 只 存储 系数 ， 
那么 就 仅 适合 所 有 方 寡 都 存在 的 情况 ,类 似 上 面 比较 规范 的 范例 ,否则 就 会 浪费 大 量 存 储 单 
元 。 如 果 通 过 二 维 数组 同时 存储 系数 和 指数 ,虽然 可 以 节省 系数 为 零 的 项 目 所 占 空 间 , 但 是 
由 于 在 多 项 式 加 减法 过 程 中 会 出 现 增 加 项 目 或 删除 项 目的 情况 ,会 引发 大 量 数据 的 移动 ,时 
间 效 率 太 低 ,非常 不 理想 。 链 表 结 点 是 在 需要 时 临时 申请 ,需要 删除 时 归还 给 操作 系统 ,所 
以 用 链表 表示 多 项 式 是 最 佳 选择 ,在 程序 设计 中 不 会 产生 数据 的 移动 。 

第 三 ,设计 算法 。 对 于 两 个 多 项 式 , 要 分 别 启用 两 个 搜索 指针 进行 管理 ,根据 情况 决定 
同时 向 前 移动 还 是 移动 其 一 。 具 体 编程 时 可 以 使 用 “新 构 法 ”, 就 是 在 原来 两 个 数据 结构 不 
变 的 情况 下 ,产生 一 个 新 的 结构 ,如 多 项 式 的 加 法 简 记 为 pc 一 pa 十 pb。 另 外 一 种 思路 叫 “ 覆 
盖 法 ”, 就 是 把 结果 放 在 原来 的 数据 结构 之 一 上 ,一 旦 操作 完成 ,原来 的 结构 之 一 就 被 破坏 
了 , 简 记 为 pa 二 pa 十 pb 或 pb 二 pa 十 pb。 如 果 其 中 一 个 结构 已 经 处 理 完毕 ,那么 男 外 一 个 结 
构 的 所 有 结 点 还 需要 继续 处 理 。 减 法 可 以 采用 把 第 二 个 多 项 式 系数 全 部 乘 以 一 1, 然 后 调用 
加 法 算法 完成 。 


2.8 本 章 总 结 


本 章 主要 介绍 线性 表 的 逻辑 结构 以 及 它 的 存储 结构 : 顺序 表 、 链 表 。 这 些 构成 了 所 有 
数据 结构 的 重要 基础 。 需 要 熟练 掌握 本 章 的 基本 概念 和 基本 操作 的 编程 才能 学 好 后 面 的 
知识 。 

基于 链表 的 编程 通常 比 数组 难 ,需要 多 画 示 意图 ,多 编程 和 调试 ,才能 较 好 地 掌握 。 

不 同 的 存储 结构 各 有 优 缺 点 ,线性 表 的 顺序 存储 有 3 个 优点 : 四 思路 和 实现 都 比较 简 
单 ,容易 理解 。@ 不 用 为 表示 结 点 间 的 逻辑 关系 而 增加 额外 的 存储 空间 。@ 顺 序 表 具 有 按 
元 素 序号 “随机 访问 ”的 特点 ,访问 数据 的 速度 较 快 。 但 顺序 存储 也 有 两 个 缺点 : 在 顺 
序 表 中 进行 插入 、 删 除 操作 时 ,平均 移动 表 中 大 约 一 半 的 元 素 , 因 此 数据 量 较 大 时 时 间 效 
率 过 低 。@ 需 要 预先 分 配 恰当 的 存储 空间 ,过 大 可 能 会 导致 大 量 浪费 ; 过 小 又 会 频繁 造 
成 溢出 。 链 表 的 优 缺 点 恰好 与 顺序 表 相 反 , 如 前 所 述 , 动 态 操 作 不 引起 数据 移动 ,但 是 对 
于 数据 的 访问 而 言 只 能 是 “顺序 访问 ”。 后 面 的 章节 里 会 设法 把 这 两 种 方法 的 优点 做 一 


个 综合 。 


习 题 


一 、 原 理 讨 论题 

1. 顺序 存储 和 链表 存储 的 优 缺点 对 比分 析 。 
2. 写 出 逻辑 结构 的 种 类 和 名 称 。 

3. 写 出 存储 结构 的 种 类 和 名 称 。 

4. 写 出 主要 的 线性 表 的 操作 清单 。 
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二 、 理论 基本 题 
. 写 出 以 下 概念 的 定义 : 线性 表 、 表 长 .直接 前 趋 、 直 接 后 继 。 
. 线性 表 顺 序 存储 结构 地 址 计算 公式 的 示意 图 。 
.给 出 5 个 数据 , 画 出 线性 表 顺 序 存储 结构 插入 数据 的 示意 图 。 
. 给 出 5 个 数据 , 画 出 线性 表 顺序 存储 结构 删除 数据 的 示意 图 。 
. 给 出 5 个 数据 , 画 出 线性 表 链 接 存储 结构 插入 数据 的 示意 图 。 
.给 出 5 个 数据 , 画 出 线性 表 链 接 存储 结构 删除 数据 的 示意 图 。 
. 给 出 5 个 数据 , 画 出 线性 表 链 接 存 储 结构 变形 (循环 ) 的 示意 图 以 及 插入 和 删除 操作 
的 示意 图 。 

8. 给 出 5 个 数据 , 画 出 线性 表 链 接 存储 结构 变形 (双向 ) 的 示意 图 以 及 插入 和 删除 操作 
的 示意 图 。 

三 、 编 程 基本 题 

1. 对 一 个 顺序 表 进 行 真正 的 逆 置 ( 即 不 是 仅 在 屏幕 上 显示 出 逆序 效果 ) , 除 原 占用 空间 
外 只 能 使 用 一 个 附加 存储 单元 。 

2. 给 定 参 数 n 和 m, 在 顺序 表 中 从 第 n 个 数据 开始 删除 m 个 数据 。 

3. 在 一 个 有 序 ( 从 小 到 大 ) 顺 序 表 中 ,插入 一 个 数据 ,要 求 继续 保持 有 序 。 

4. 在 一 个 有 序 ( 从 小 到 大 ) 链 表 中 ,插入 一 个 数据 ,要 求 继续 保持 有 序 。 

5. 有 两 个 长 度 相 同 的 单 链表 ,编程 进行 合并 ,数据 为 每 一 个 表 中 依次 取 一 个 。 如 (1,3， 
5) 和 (2,4,6) 合 并 结果 为 (1,2,3,4,5,6)。 

6. 模仿 教材 中 范例 实现 循环 链表 下 线性 表 的 基本 操作 。 

7. 模仿 教材 中 范例 实现 双向 循环 链表 下 线性 表 的 基本 操作 。 

8. 如 果 一 个 链表 中 数据 可 以 相同 ,编程 统计 某 个 数据 在 链表 中 的 个 数 。 

9. 编写 程序 ,判断 链表 中 数据 是 否 从 小 到 大 排列 。 

10. 有 两 个 分 别 带头 结 点 的 循环 单 链表 ,将 第 二 个 表 归 并 到 第 一 个 表 上 去 ,结果 还 是 带 
头 结 点 的 循环 单 链表 。 

11. 从 键盘 输入 线性 表 中 的 多 个 整数 ,然后 分 别 统 计 出 小 于 零 、 等 于 零 和 大 于 零 的 数据 


A 


个 数 。 
12. 静态 链表 的 基本 操作 编程 ,用 菜单 的 形式 管理 ,建议 其 中 一 项 功能 为 对 比 显示 所 有 
实际 数据 的 下 标 链 和 空闲 空间 的 下 标 链 。 

13. 将 单 链表 中 所 有 数据 进行 逆序 处 理 , 不 是 显示 ,而 是 内 部 数据 真正 被 颠倒 了 次 序 ， 
要 求 处 理 时 不 建立 新 的 链表 。 已 知 单 链表 headp, 如 图 2-11 所 示 。 


过 9 \ 


headp HFA Pr [WN 2 区 333 | 信 
-17 To 六 Te 


‘\@ _-- 
SS pnow pnow 
ptemp ©® 
图 2-11 带头 结 点 的 单 链表 就 地 逆 置 示意 图 
算法 思路 : 依次 取 原 链表 中 的 每 个 结 点 ,将 其 作为 第 一 个 结 点 插入 到 新 链表 中 ,指针 
pnow 用 来 指向 当前 结 点 ,pnow 为 空 时 算法 结束 。 
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14. 删除 单 链 表 中 的 重复 结 点 ,已 知 单 链表 Head, 编 写 算法 删除 其 重复 结 点 。 算 法 思 
路 : 用 指针 pointer01 指向 第 一 个 数据 结 点 ,从 它 的 后 继 结 点 开始 直到 表 结 束 , 查 找 与 其 值 
相同 的 结 点 并 删除 ; 然后 将 pointer01 指向 下 一 个 结 点 ; 以 此 类 推 ,pointer01 指向 最 后 一 个 
结 点 时 算法 结束 。 

15. 程序 设计 。 把 3 个 人 (可 改 为 多 个 ) 的 个 人 信息 从 键盘 输入 ,含有 学 号 、 姓 名 、 电 话 、 身 
高 4 个 信息 (可 增加 其 他 信息 ), 存 入 结构 体 组 成 的 一 维 数组 中 ,显示 一 次 ,然后 把 数组 中 的 所 
有 数据 建立 一 个 链表 ,再 显示 一 次 ,之 后 把 链表 中 的 数据 存 人 文件 ,提示 结果 在 什么 文件 中 。 

运行 效果 范例 : 

下 面 输入 第 1 个 人 的 信息 

请 输入 学 号 :xx 

请 输入 姓名 : xx 

请 输入 电话 : xx 


请 输入 身高 : ** 
下 面 输入 第 2 个 人 的 信息 


所 有 数据 已 经 输入 完毕 … 
以 下 为 显示 所 有 数据 


所 有 数据 已 存 入 链表 … 
以 下 再 次 显示 数据 


所 有 数据 已 存 人 文件 

请 打开 文件 : DATAFILE. TXT 观看 数据 … 

谢谢 使 用 本 软件 , 按 任意 键 退出 

四 、 编 程 提高 题 

1. 将 两 个 有 序 ( 从 小 到 大 ) 顺 序 表 进 行 合 并 ,采用 C=A+B 的 模式 ,即使 用 “新 构 法 ”， 
要 求 C 的 元 素 也 按 从 小 到 大 的 顺序 排列 。 算 法 思路 : 依次 扫描 A 和 B 的 元 素 , 比 较 当前 元 
素 的 值 ,将 值 较 小 者 赋 给 C, 直 到 其 中 一 个 线性 表 扫 描 完 毕 ,然后 将 未 完 的 顺序 表 中 余下 的 
部 分 依次 赋 给 C 即 可 ,顺序 表 C 的 空间 大 小 要 能 够 容纳 A、B 两 个 顺序 表 长 度 之 和 。 

2. 将 两 个 有 序 ( 从 小 到 大 ) 顺 序 表 进 行 合 并 ,采用 A 二 A 十 B 的 模式 ,即使 用 “覆盖 法 ”， 
最 后 合并 的 结果 存 人 第 一 个 顺序 表 中 。 

3. 以 上 两 题 如 果 存 储 结构 选择 链接 存储 , 试 编程 实现 。 

4. A 顺序 表 递 增 有 序 ,B 顺序 表 递 减 有 序 (无 A 中 相同 元 素 ) ,编程 把 B 中 所 有 元 素 进 
和 人 和 A, 保 持 递 增 有 序 。 

5. 将 两 个 有 序 ( 从 小 到 大 ) 顺 序 表 中 的 相同 元 素 找到 并 且 按照 从 大 到 小 的 次 序 排列 在 
新 的 有 序 表 中 。 

6. 根据 数据 是 否 大 于 零 或 者 小 于 等 于 零 ,把 一 个 顺序 表 分 成 两 个 顺序 表 。 

7. 由 于 C++ 请 言 中 对 于 整数 的 范围 限制 ,使 得 过 大 的 整数 求 阶乘 时 产生 溢出 。 试 采用 
一 维 数组 来 存储 任意 大 小 整数 的 阶乘 结果 (其 长 度 只 受 一 维 数组 的 长 度 限制 ) 。 

8. 编制 有 序 ( 从 小 到 大 ) 链 表 的 合并 程序 ,可 以 按照 A=A 十 B 的 思路 编程 ,或 者 按照 
C=A+B 的 思路 编程 。 

9. 使 用 链表 结构 编制 程序 实现 多 项 式 的 加 法 、 减 法 等 常规 操作 。 
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10. 编程 实现 集合 的 交 、 并 等 常用 操作 。 

五 、 思 考题 

1. 如 果 把 n 个 顺序 表 同 时 放 在 一 个 数组 空间 上 ,如 何 管理 插入 和 删除 操作 ? 

2. 两 个 线性 表 的 比较 方法 约定 如 下 : 设 A、B 是 两 个 线性 表 , 其 中 数据 约定 为 整数 , 表 
长 分 别 为 m 和 n。A' 和 B' 分 别 为 A 和 B 中 除去 最 大 共同 前 级 后 的 子 表 。 例 如 A= (1,2， 
2,3,1,3),B 二 (1,2,2,3,2,1,1,3), 两 表 的 最 大 共同 前 级 为 (1,2,2,3), 则 A' 一 (1,3),B' 一 
(2,1,1,3), 若 A' 和 B' 均 为 空 表 , 则 A=B; 若 A' 为 空 表 且 B' 不 为 空 表 , 或 两 者 均 不 空 且 A' 
的 首 元 素 小 于 B' 的 首 元 素 , 则 A 王 B, 和 否则 ,A 二 B。 算 法 思路 : 依次 比较 两 个 表 相 同位 置 的 
元 素 , 如 果 两 个 表 同 时 结束 全 部 一 样 , 则 A=B 返 回 0, 如 果 第 一 个 表 中 某 个 元 素 比 第 二 个 
表 中 的 相应 元 素 小 , 则 A 二 B 返回 一 1, 其 他 情况 为 A 二 B, 则 函数 返回 1。 本 操作 在 顺序 存 
储 和 链接 存储 两 种 结构 下 如 何 具体 编程 实现 ? 

3. 多 个 (Cn>2) 有 序 表 的 合并 和 两 个 有 序 表 的 合并 有 什么 关系 ? 如 何 尽 量 利 用 已 经 编 
好 的 程序 ? 

4. 合并 两 个 有 序 表 时 ,如 果 要 求 相 同 的 数据 只 存 一 份 , 那 么 在 程序 设计 中 如 何 变化 ? 

5. 如 果 两 个 顺序 表 连 续 放 在 一 个 数组 中 ,怎样 变化 两 个 顺序 表 前 后 的 位 置 ? 
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本 童 介绍 线性 表 的 一 个 基本 应 用 一 一 查找 和 排序 。 讲 解 查找 和 排序 相关 的 基本 概念 和 
基本 思路 ,具体 介绍 顺序 查找 、 直 接 插入 排序 简单 选择 排序 、 冒 泡 排序 单 链表 插入 排序 ,给 
出 其 程序 设计 源码 ,体现 了 线性 表 的 实用 功能 。 


3.1 引 


了 中 


在 计算 机 程序 设计 中 ,一 个 最 常用 的 功能 就 是 对 数据 的 查找 。 在 计算 机 应 用 中 ,不 论 是 
静态 操作 ,还 是 动态 操作 ,大 多 是 基于 查找 技术 的 ,因为 要 对 某 个 数据 进行 操作 ,就 必须 先 找 
到 这 个 数据 的 位 置 ,而 为 了 使 计算 机 查询 数据 更 快捷 、 准 确 ,就 要 研究 数据 结构 对 查找 技术 
的 影响 。 

例 3-1 在 英汉 字典 中 查找 某 个 英文 单词 的 中 文 释义 ,在 新 华 字典 中 通过 汉语 拼音 或 
字形 查找 某 个 汉字 的 释义 ,在 对 数 表 中 查找 某 个 数 的 对 数 ,在 平方 根 表 中 查找 某 个 数 的 平方 
根 ,邮递 员 在 城市 中 按 收 件 人 的 地 址 确定 位 置 等 ,都 是 查找 的 应 用 范例 。 


3.2 查找 的 基本 概念 


对 于 线性 关系 的 数据 结构 而 言 查找 比较 容易 实现 ,因为 数据 之 间 是 一 维 线性 关系 。 

不 论 是 哪 种 逻辑 结构 和 存储 结构 ,都 有 一 个 如 何 提高 查找 算法 时 间 效 率 的 问题 ,因为 查 
找 技术 一 旦 运用 在 海量 数据 集 时 ,查找 时 间 就 是 一 个 重要 指标 。 

数据 项 (也 称 项 或 字段 ) 是 具有 独立 含义 的 标识 单位 ,是 数据 不 可 分 割 的 最 小 单位 。 项 
还 有 “名 ”和 “ 值 ” 之 分 ,“ 项 名 ”是 一 个 项 的 标识 名 ,可 以 用 变量 定义 ,而 “项 值 * 是 项 可 能 取 
的 值 。 

@ 组 合 项 。 由 若干 数据 项 组 合 构 成 。 

@ 记录 。 由 若干 项 ` 组 合 项 构成 的 数据 单位 ,是 在 某 一 应 用 中 作为 整体 进行 考虑 和 处 
理 的 基本 单位 。 

@ 关键 码 。 关 键 码 是 数据 元 素 ( 记 录 ) 中 某 个 项 或 组 合 项 的 值 ,用 它 可 以 标识 一 个 数据 
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元 素 ( 记 录 )。 能 唯一 确定 一 个 数据 元 素 ( 记 录 ) 的 关键 码 称 为 主 关 键 码 ; 不 能 唯一 确定 一 个 
数据 元 素 (记录 ) 的 关键 码 称 为 次 关键 码 。 

@ 查找 表 。 查 找 表 是 由 具有 同一 类 型 (属性 ) 的 数据 元 素 ( 记 录 ) 组 成 的 集合 。 它 分 为 
静态 查找 表 和 动态 查找 表 两 类 。 

@ 静态 查找 表 。 仅 对 查找 表 进 行 查找 操作 ,不 进行 其 他 操作 的 表 就 是 静态 查找 表 。 

@ 动态 查找 表 。 对 查找 表 进 行 查找 操作 ,同时 还 要 向 表 中 插入 或 删除 该 数据 元 素 操 
作 的 。 

@ 查找 。 查 找 就 是 按 给 定 的 某 个 值 value, 在 查找 表 中 查找 关键 码 为 给 定 值 value 的 数 
据 元 素 ( 记 录 )。 

关键 码 是 主 关键 码 时 ,由 于 主 关键 码 是 唯一 的 ,查找 结果 也 唯一 。 对 于 调用 查找 功能 的 
函数 来 说 ,返回 数据 或 者 是 找到 的 数据 元 素 ( 记 录 ) 的 信息 ,或 者 是 该 数据 元 素 (记录 ) 的 位 
置 。 如 果 确 认 没 有 该 数据 , 则 查找 失败 。 此 时 查找 结果 根据 程序 中 存储 结构 和 其 他 细节 可 
以 返回 以 下 几 种 结果 之 一 : 假 值 (表示 没有 找到 )、 空 记录 、 空 指针 。 

关键 码 是 次 关键 码 时 ,必须 查 完 表 中 所 有 数据 元 素 ( 记 录 ) ,或 在 可 以 肯定 查找 失败 时 ， 
才能 结束 查找 过 程 。 查 找 成 功 时 可 以 选择 找到 所 谓 的 “第 一 个 ”符合 条 件 的 数据 ,或 者 找到 
所 有 符合 条 件 的 全 部 数据 。 

在 计算 机 中 存储 查找 表 , 就 需要 定义 查找 表 的 结构 ,并 根据 查找 表 的 大 小 为 表 分 配 存储 
单元 。 


3.3 顺序 查找 技术 


本 节 讨 论 线性 结构 中 的 查找 ,因为 数据 关系 是 一 维 结构 ,可 以 用 线性 表 的 遍历 思路 来 进 
行 查找 工作 。 在 查找 失败 后 ,返回 失败 信息 。 

Q@ 静态 查找 表 结 构 。 静 态 查 找 表 一 般 可 以 使 用 线性 表 , 存 储 方案 可 以 是 数组 或 链接 
存储 。 

@ 顺序 查找 的 思路 就 是 线性 表 遍 历 查 找 法 。 从 表 的 一 端 开 始 , 向 另 一 端 逐 个 按 给 定 值 
与 关键 码 进行 比较 , 若 找 到 ,查找 成 功 ,并 给 出 数据 元 素 在 表 中 的 位 置 ; 若 整个 表 检 测 完 , 仍 
未 找到 相同 的 关键 码 , 则 查找 失败 ,给 出 失败 信息 。 

从 数据 结构 的 逻辑 关系 层面 考虑 ,顺序 查找 的 方向 可 以 从 左 到 右 , 也 可 以 从 右 到 左 。 但 
是 如 果 进 一 步 考虑 存储 结构 ,该 结论 就 不 一 定 正 确 , 比 如 单 链 表 只 能 从 左 到 右 , 如 果 已 经 决 
定 使 用 链表 ,又 要 考虑 从 右 到 左 的 查找 ,显然 必须 启用 双向 链表 ,为 了 操作 方便 性 而 付出 空 
间 代 价 。 

从 查找 结果 看 ,如果 是 按照 主 关键 码 进行 查找 ,那么 从 左 到 右 和 从 右 到 左 查 找 的 结 
果 一 样 ,成 功 后 位 置 一 样 。 如 果 是 次 关键 码 ,既然 数据 可 能 重复 ,从 左 到 右 查 找到 的 为 多 
辑 上 的 第 一 个 符合 条 件 的 数据 ,而 从 右 到 左 查找 到 则 为 逻辑 上 最 后 一 个 符合 条 件 的 
数据 。 

图 3-1 是 顺序 查找 的 示意 图 。 采 用 数组 存储 ,0 号 单元 暂时 空置 。 这 样 第 i 个 数据 正好 
在 第 i 个 位 置 上 ,比较 好 理解 。 这 批 数据 中 要 查找 60, 结 论 不 一 样 ,因为 有 3 个 60。 从 左 到 
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右 为 4, 从 右 到 左 为 10。 
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3-1 顺序 查找 的 示意 图 


上 面 这 个 算法 设计 中 循环 的 结束 条 件 必须 考虑 两 个 因素 ,就 是 如果 没有 查 完 而 且 没 有 
查 到 就 一 直 查 下 去 ”"。 注 意 这 两 个 条 件 的 关系 必须 同时 成 立 ,只 要 其 中 一 个 条 件 不 成 立 , 就 
说 明 或 者 找到 了 ,或 者 失败 了 。 

由 于 启用 了 循环 ,这 个 算法 的 时 间 复 杂 度 是 O(n) ,但 是 依然 可 以 设法 提高 时 间 效 率 。 
技巧 是 把 要 查找 的 数据 存储 在 0 号 单元 中 ,采用 从 尾 到 头 法 进行 查找 ,这 样 至 少 会 在 0 号 单 
元 中 遇 到 它 ,而 0 正好 是 C++ 语言 中 表示 ”“ 假 ”的 值 ,所 以 算法 中 的 两 个 条 件 就 可 以 优化 为 一 
个 条 件 , 那 就 是 “如果 没有 找到 ,就 一 直 找 下 去 ”。 虽 然 只 是 在 循环 条 件 上 进行 了 一 个 小 改 
动 , 但 是 在 海量 数据 条 件 下 ,这 个 改进 却 是 有 价值 的 改进 ,因为 多 条 件 的 联合 判断 比 单条 件 
的 判断 需要 多 一 些 计 算 时 间 。 

这 个 算法 中 的 0 号 单元 被 称 为 “哨兵 元 素 ”。 

这 个 算法 中 的 基本 操作 就 是 关键 码 的 比较 ,不 论 是 否 启用 哨兵 元 素 , 循 环 都 不 可 避免 ， 
因此 查找 数据 量 ( 即 线性 表 的 长 度 ) 的 数量 级 就 是 查找 算法 的 时 间 复 杂 度 ,为 O(n)。 

顺序 查找 的 缺点 是 , 当 数 据 量 很 大 时 ,平均 查找 长 度 较 大 ,算法 时 间 效 率 过 低 ; 优点 是 
对 表 中 数据 元 素 的 存储 结构 没有 特殊 要 求 。 如 果 存 储 结构 是 单 链 表 , 则 只 能 进行 顺序 查找 。 

【程序 源码 3-1】 常规 查找 算法 的 实现 和 对 比 的 部 分 源码 。 

// 顺 序 查找 3 种 方法 

// 从 左 到 右 、 从 右 到 左 、 带 哨兵 元 素 等 方法 的 细节 对 比 

# include < iostream.h> 


#include < windows.h> 


# include < iomanip.h> 


32 


searcharray | 


# define datawidth 5 // 设 置 数 据 显 示 宽 度 

# define arraymaxnum 21 // 约 定数 组 大 小 ,0 号 单元 默认 不 用 , 故 用 户 数据 
// 可 以 接受 20 个 

# define defaultnum 13 // 约 定 默认 数据 数组 大 小 ,数据 使 用 教材 实际 范例 

int defaultdata[ defaultnum] = {0, 32,10, 41, 60, 24, 82, 60,90,45,60,23,75}; 
/10 号 下 标 默 认 不 用 , 故 存 0 

int flag= 0; // 表 示 用 户 没有 输入 数据 ,使 用 默认 数据 

// 顺 序 对 象 设计 

class seqsearching //seq: 顺 序 searching: 查 找 

{ 

public: 


int ltorsearching(int * data, int length, int seekdata);  //1:left 左 ,r:right 右 ,to: 到 
int rtolsearching( int * data, int length, int seekdata); 

int guardsearching( int * data int length, int seekdata); // 哨 兵 元 素 查 找 法 

void displaydata( int * data, int length ); 
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}; 
int seqsearching: :ltorsearching( int * data, int length, int seekdata) 


{ 
int i=1; // 从 右 到 左 时 ,开始 查找 的 下 标 为 1 
while(i< = length && data[i]!= seekdata)  // 两 个 条 件 为 : 当 没 有 找 完 而 且 没 有 找到 时 一 直 
// 循 环 
++; 
if(i<= length) // 如 果 是 正常 范围 内 结束 ,说 明 找 到 了 ,否则 说 明 
// 查 找 失 败 
return i; 
else 
return 0; 
上 
int seqsearching: :rtolsearching(int * data int length, int seekdata) 
{ 
int i= length; // 从 右 到 左 时 ,开始 查找 的 下 标 为 length 
while(i>0 && data[ i]!= seekdata) 
和 
if(i>=1) 
return i; 
else 
return 0; 


} 
int seqsearching: :guardsearching( int * data, int length, int seekdata) 
{ 

data[0] = seekdata; 


int i= length; // 从 右 到 左 时 ,开始 查找 的 下 标 为 length 

while(data[ i]!= seekdata) // 此 算法 的 优点 ,把 两 个 条 件 改 成 了 一 个 ,减少 了 
// 逻 辑 运算 量 

a 

return i; 


} 
void seqsearching: :displaydata( int x data, int length) // 从 坐标 1 开始 显示 到 第 number 个 数据 
{ 
int i; 
cout <<" 坐 标 : "; 
for(i=1;i<= length;i++) 
cout << setw( datawidth)<< i; 
cout << endl; 
cout <<" 数 据 :"; 
for(i=1;i<= length;i++) 
cout << setw(datawidth)<< data[ i]; 
cout << endl; 
} 


图 3-2 为 顺序 查找 程序 运行 图 。 
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3-2 ”顺序 查找 程序 运行 图 


3.4 排序 基础 和 基本 概念 


在 计算 机 程序 设计 中 , 另 一 个 常用 的 功能 就 是 数据 排序 ,因为 无 序 的 数据 和 有 序 的 数据 
之 间 实 际 上 是 有 信息 差异 的 。 表 3-1 为 运动 会 上 8 名 运动 员 在 100 米 短跑 中 的 成 绩 ,需要 
编程 求 出 冠军 .亚军 和 季军 。 
表 3-1 一 批 100 米 短 跑 成 绩 原始 数据 


因为 输入 数据 时 这 批 数据 是 无 序 的 ,所 以 该 程序 的 功能 就 是 要 求 出 其 最 小 值 . 次 小 值 和 
第 三 个 最 小 值 。 如 果 仅仅 要 求 出 一 批 数据 的 最 小 值 , 那 么 用 “扫描 法 ”是 很 容易 求 出 其 位 置 
的 ,但 是 如 果 要 求 同 时 记录 出 次 小 值 和 第 三 个 最 小 值 的 位 置 , 则 该 算法 的 难度 就 会 上 升 。 通 
常 采用 的 思路 为 ,设法 取消 最 小 值 , 然 后 在 剩 下 的 数据 里 重复 “扫描 法 ”的 算法 思路 ,那么 要 
求 出 前 三 名 的 话 就 必须 调用 同样 的 函数 三 次 。 如 果 对 这 批 数 据 先 做 一 次 从 小 到 大 的 排序 操 
作 , 那 么 不 光 前 三 名 的 次 序 出 来 了 ,而 且 全 部 运动 员 的 排名 同时 全 部 出 来 了 。 表 3-2 为 已 经 
排 成 升序 的 100 米 短跑 成 绩 数据 。 


表 3-2 已 经 排 成 升序 的 100 米 短 跑 成 绩 数据 


在 这 批 数据 里 ,没有 附加 运动 员 编号 或 姓名 等 信息 ,仅仅 抽象 出 实际 的 跑步 成 绩 进 行 处 
理 , 如 果 需 要 在 输出 时 提供 运动 员 的 个 人 信息 , 则 通过 增加 结构 体 的 方式 进行 排序 即 可 完 
成 。 另 外 ,由 于 跑步 成 绩 有 可 能 完全 相同 ,所 以 在 被 排序 的 数据 中 ,出 现 相 同 的 数据 完全 是 
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正常 的 。 表 3-3 为 带 有 个 人 信息 的 100 米 短跑 成 绩 原始 数据 。 
表 3-3 带 有 个 人 信息 的 100 米 短跑 成 绩 原始 数据 


运动 员 编号 2584 3615 4257 1258 3549 3584 6547 3647 
运动 员 姓 名 三 李 四 王 五 杨 六 赵 七 马 八 钱 九 王政 
成 绩 9.65 9.72 9.61 9.58 9.9 9.76 10.1 9.76 


在 计算 机 编程 中 ,许多 功能 都 会 有 一 个 前 提 , 即 要 求 把 相关 数据 先行 (从 小 到 大 或 从 大 
到 小 ) 排 序 。 

由 于 计算 机 程序 的 “点 式 思维 "和 人 的 “ 面 式 思维 ”不同 ,在 设计 排序 程序 时 通常 第 一 步 
就 是 把 数据 组 织 成 (一 维 ) 线 性 结构 ,也 就 是 数据 结构 “线性 表 ”, 以 便于 进行 “扫描 法 ”程序 
设计 。 

排序 是 程序 设计 中 非常 重要 的 应 用 之 一 ,吸引 了 世界 上 很 多 计算 机 科学 家 研究 该 课题 ， 
排序 方法 也 是 种 类 繁多 。 在 后 续 的 章节 中 ,会 深入 讨论 利用 更 为 复杂 的 数据 结构 和 算法 进 
行 排序 的 各 种 算法 。 

排序 (Sorting) 是 将 一 个 数据 元 素 集合 或 序列 重新 排列 成 一 个 按 数据 元 素 某 个 项 值 有 
序 ( 从 大 到 小 或 从 小 到 大 ) 的 序列 。 

如 果 要 排序 的 是 由 多 个 数据 项 组 成 的 记录 ,那么 把 作为 排序 依据 的 那个 数据 项 称 为 “ 排 
序 码 ”, 也 叫做 数据 元 素 的 “关键 码 ”。 

关键 码 分 为 两 种 ,一 种 是 可 以 唯一 地 标识 每 一 个 记录 的 ,就 是 区 分 每 个 记录 的 数据 项 ， 
称 为 “ 主 关键 码 ”。 另 外 一 种 是 次 关键 码 ,这 种 数据 项 可 以 是 相同 的 。 若 关键 码 是 主 关键 码 ， 
则 对 于 任意 待 排序 序列 ,经 排序 后 得 到 的 结果 显然 就 是 唯一 的 ; 若 关键 码 是 次 关键 码 ,排序 
结果 可 能 就 不 唯一 ,因为 具有 相同 关键 码 的 数据 元 素 在 排序 结束 后 ,它们 之 间 的 位 置 跟 排序 
前 相 比 可 能 已 经 交换 。 

由 于 现实 生活 中 ,人 名 是 可 能 会 重复 的 ( 表 3-3 中 有 两 个 “ 王 五 ”) ,所 以 姓名 就 没有 资格 
作为 “ 主 关键 码 ”。 而 运动 员 编号 则 必须 唯一 ,那么 它 就 可 以 作为 主 关键 码 来 区 分 任何 两 个 
不 同 的 运动 员 。 如 果 把 运动 员 编号 作为 整数 ,那么 其 排序 的 方法 在 本 章 给 出 ,如 果 作 为 字符 
串 处 理 , 则 涉及 数据 结构 字符 串 的 比较 和 排序 技术 ,而 中 文 的 姓名 也 是 一 种 特殊 的 字符 串 ， 
对 于 字符 串 的 比较 和 排序 技术 在 后 面 的 章节 中 会 介绍 。 

对 任意 数据 元 素 序列 ,使 用 某 种 排序 方法 ,对 它 按 次 关键 码 进 行 排序 : 若 相 同 关键 码 元 
素 间 的 位 置 关系 排序 前 与 排序 后 保持 不 变 , 则 称 此 排序 方法 是 稳定 的 ; 而 不 能 保持 一 致 的 
排序 方法 则 称 为 不 稳定 的 排序 方法 。 因 为 排序 后 相同 的 数据 必然 放 在 一 起 ,所 以 较 少数 据 
交换 次 数 也 是 提高 算法 效率 的 一 个 基本 考虑 。 基 于 此 ,在 程序 设计 中 ,如 果 某 种 思路 可 以 稳 
定 排 序 ,那么 就 不 要 编写 成 不 稳定 的 ,因为 那样 会 增加 交换 数据 带 来 的 时 间 代价 。 

由 于 数据 量 过 大 有 时 不 能 完全 一 次 性 把 全 部 数据 放 和 内存, 这 对 于 算法 的 思路 有 着 重 
大 的 影响 。 根 据 数据 全 部 在 内 存 中 还 是 部 分 进入 内 存 通常 把 排序 分 为 两 类 : 内 排序 和 外 
排序 。 内 排序 指 待 排序 列 完全 存放 在 内 存 中 所 进行 的 排序 。 外 排序 指 排序 过 程 中 还 需 
要 不 断 地 访问 外 存储 器 以 调和 其 他 数据 来 和 内 存 配合 对 全 部 数据 进行 排序 。 本 书 只 介 
绍 内 排序 。 

由 于 线性 表 可 以 采用 顺序 表 和 链表 ,所 以 在 排序 程序 设计 中 ,也 需要 讨论 在 不 同 的 存储 
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情况 下 如 何 实现 排序 。 

排序 主要 涉及 3 种 基本 操作 。 

第 一 种 操作 是 “比较 ”。 因 为 通过 两 个 数据 的 比较 ,才能 知道 它们 的 相对 位 置 是 不 符合 
排序 结果 的 。 

第 二 种 操作 是 “交换 ”。 因 为 知道 某 两 个 数据 的 相对 位 置 不 对 , 则 通过 交换 这 两 个 数据 
之 间 的 位 置 可 以 达到 符合 要 求 的 次 序 。 

第 三 种 操作 是 “成 批 移 动 ”, 它 是 “交换 "的 变形 。 通 过 把 一 大 批 数 据 从 某 一 片 存储 区 域 
换 到 另外 的 存储 区 域 来 达到 符合 排序 要 求 的 次 序 。 

这 三 种 操作 要 不 断 地 调用 各 个 数据 的 存储 地 址 ,所 以 启用 顺序 存储 结构 是 排序 算法 的 
首选 ,而 数组 的 下 标 就 是 很 好 的 地 址 控制 机 制 。 

采用 链表 存储 时 ,很 多 排序 算法 将 无 法 使 用 ,所 以 有 很 大 的 局 限 性 。 如 果 某 批 数据 已 经 
存 人 链表 ,又 需要 排序 ,那么 一 般 建议 是 先 把 链表 中 的 数据 复制 一 份 到 数组 中 ,然后 进行 排 
序 ,至 于 排序 后 是 否 还 用 链表 保存 则 根据 当时 的 具体 情况 区 别 对 待 。 

从 程序 设计 的 思路 看 ,从 小 到 大 和 从 大 到 小 排序 的 算法 并 无 本 质 的 区 别 ,在 程序 设计 中 
通常 是 对 大 于 号 或 小 于 号 的 选择 , 故 本 章 约定 所 有 的 排序 都 是 从 小 到 大 排序 。 

C 语言 中 数组 的 下 标 是 从 0 单元 开始 的 ,如 果 有 时 说 到 第 8 个 数据 存放 在 第 7 号 存储 

单元 时 ,总 有 些 奇 怪 ,为 了 增加 程序 的 逻辑 清晰 性 ,有 时 启用 数组 时 可 以 把 下 标 0 的 位 置 故 
意 空 置 不 用 ,实际 数据 从 下 标 1 的 位 置 开 始 放置 。 如 果 数 据 量 最 大 值 为 MaxSize, 那 么 申请 
空间 时 建议 用 MaxSize 十 1, 这 样 实际 数据 的 存储 空间 为 1 一 MaxSize, 可 以 吻合 第 i 个 数据 
正好 在 第 i 号 下 标的 位 置 上 ,从 逻辑 层面 比较 容易 理解 。 

有 时 空置 的 0 下 标 存储 空间 可 以 被 利用 ,如 果 存 储 的 数据 正好 是 整数 ,那么 这 个 位 置 可 
以 用 来 存放 数据 个 数 等 信息 ,在 这 些 算法 中 正好 就 利用 了 这 个 单元 。 

另外 用 数组 来 进行 排序 只 是 在 内 存 中 的 实现 方案 ,更 有 实用 价值 的 排序 操作 应 该 是 基 
于 “文件 ”的 ,也 就 是 把 未 排序 的 数据 从 一 个 文件 中 读 入 内 存 , 然 后 在 内 存 中 进行 排序 操作 ， 
最 后 把 结果 再 写 人 该 文件 或 者 一 个 新 文件 中 ,而 已 经 排 好 序 的 文件 可 以 在 其 他 时 候 随 时 打 
开 查 看 ,或 者 被 其 他 程序 读 入 内 存 继续 进行 其 他 处 理 , 这 样 已 排序 数据 就 可 以 被 多 次 和 长 期 
使 用 了 。 


3.5 基本 排序 算法 设计 


3.5.1 排序 算法 设计 基础 


约定 所 有 没有 排序 的 数据 为 待 排 数 据 "( 即 等 待 排序 的 数据 ) ,结合 存储 结构 ,又 称 为 
“ 待 排 空 间 ”。 把 已 经 排序 的 数据 称 为 “已 排 数 据 ”, 相 应 的 则 有 "已 排 空 间 ”。 

本 章 介绍 的 基本 排序 思路 大 都 为 “逐步 缩小 待 排 空间 ,直到 把 整个 数据 空间 变 为 已 排 
空间 ”。 

例如 ,如 果 能 设法 找到 所 有 数据 的 最 小 值 ,然后 把 它 换 到 最 前 面 的 位 置 上 ,此 时 第 一 个 
数据 就 变 成 了 已 排 空间 ,而 除了 第 一 个 数据 外 的 其 他 数据 则 继续 组 成 新 的 待 排 空间 ,对 于 少 
了 一 个 数据 的 待 排 空间 而 言 , 根 据 相 同 的 思路 继续 下 去 , 慢 慢 地 待 排 空间 每 次 减少 一 个 数 
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据 , 已 排 空间 每 次 增加 一 个 数据 ,直到 所 有 数据 处 理 完毕 。 

在 逐步 缩小 待 排 空间 的 过 程 中 ,由 于 思路 不 同 ,因此 具体 实现 时 就 会 产生 不 同 的 排序 
方法 。 

在 图 3-3 的 示意 图 中 , 方 括号 表示 待 排 空间 , 圆 括号 表示 已 排 空间 ,Min 表示 目前 待 排 
空间 中 最 小 数据 ,Max 表示 最 大 数据 ,用 忽 上 和 忽 下 的 曲线 表示 数据 的 大 小 不 同和 没有 排序 
的 状态 ,min01 表示 其 中 最 小 数据 ,min02 表示 第 二 小 的 数据 。 一 旦 排序 成 功 , 则 用 一 条 从 
下 到 上 的 曲线 表示 ,代表 所 有 数据 已 排序 完毕 。 


Se 


图 3-3 基本 排序 思路 原理 示意 图 


以 下 介绍 4 种 排序 方法 : 直接 插入 排序 .简单 选择 排序 、 冒 泡 排 序 ,链表 插入 排序 ,同时 
会 给 出 简略 的 稳定 性 分 析 和 时 间 效 率 分 析 。 

在 下 面 的 程序 设计 中 ,提供 了 3 种 基础 排序 的 对 比 。 为 了 保证 基础 数据 可 以 反复 使 用 ， 
需要 考虑 每 次 复制 一 份 原始 数据 到 排序 数据 区 。 方 便 起 见 ,提供 了 键盘 输入 和 自动 生成 数 
据 两 种 方式 。 

【程序 源码 3-2】 基础 排序 3 种 方法 的 部 分 源码 。 


// 功 能 :3 种 基本 排序 方法 的 功能 演示 
#include< stdlib.h> 

# include < iomanip.h> 

# include < iostream.h> 

# include < windows.h> 

# include<time.h> 


# define MAXSIZE 100 // 支 持 排 序数 据 个 数 的 最 大 限 
# define MAXNUM 1000 // 设 置 系统 产生 数据 的 最 大 限 
int flag=0; // 用 来 标识 待 排 数 据 是 否 产生 
// 排 序 表 对 象 设计 
class list 
{ 
public: 

list(){}; 

~list(){}; 

void create( ); // 创 建 对 象 数 据 函 数 

void copy(list initlist); // 复 制 对 象 数 据 函 数 

void display(); // 显 示 数 据 函 数 

void directinsertsorting(); // 直 接 插入 排序 函数 

void simpleselectsorting(); // 简 单 选择 排序 函数 

void bubblesorting( ); // 冒 泡 排序 函数 
private: 
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int data[ MAXSIZE]; // 静 态 数组 作为 线性 表 的 存储 结构 
int total; // 数 据 量 
}; 
void list: :create() // 创 建 对 象 数据 函数 
{ 
int choice, i; 
char ch; 
if(flag==1) // 代 表 此 时 已 经 有 一 组 建立 好 的 数据 
让 
cout <<" 此 时 系统 已 经 有 一 组 建立 好 的 数据 , 您 确认 想 蔡 换 吗 ?(Y| |y) :"; 
cin>> ch; 
if(ch== 'Y'||ch== 'y') 
flag= 0; 
} 
if(flag== 0) 
{ 
cout <<" 创 建 待 排 数 据 : < 1 > 键盘 输入 <2> 自 动 生成 "<< endl <<" 请 选择 :"; 
cin >> choice; 
Switch(choice) 
{ 
case 1: 
cout <<" 请 输入 您 需要 键盘 输入 待 排 数 据 的 个 数 :"; 
cin>> total; 
cout <<" 请 开始 输入 数据 (提示 : 一 共 "<< total <<" 个 数据 ,用 空格 分 开 ) : "<< endl; 
for(i=0;i<total;i++) 
cin>> data[ i]; 
flag=1; 
break; 
Case 2: 
cout <<" 请 输入 您 需要 系统 产生 待 排 数 据 的 个 数 :"; 
cin>> total; 
cout <<" 系 统 自动 产生 "<< total <<" 个 数据 !"<< endl; 
for(i=0;i<total;i++) 
data[ i] = rand( ) % MAXNUM; // 系 统 给 出 一 个 0 一 MAXNUM 的 随机 数 
flag=1; 
break; 
default: 
cout <<" 您 输入 有 误 ! 请 重新 输入 : "<< endl; 
break; 
} 
if(flag==1) 
{ 
cout <<" 待 排 数据 如 下 .…"<< end] 
display(); 
cout <<" 待 排 数据 成 功 建立 ! "<< endl; 


} 
else 
{ 
cout <<" 你 已 经 成 功 取消 了 上 述 操 作 !"<< endl; 
} 
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} 
void list::copy(list initlist) // 复 制 对 象 数据 函数 
{ 

int i; 

for(i=0;i<initlist. total;i++) 

data[i] = initlist. data[i]; 

total = initlist. total; 
} 
void list::display() // 显 示 函 数 
{ 

dmb 

for(i=0;i<total;i+t+) 

cout << setw(5)<< setiosflags(ios: :left)<< data[ i]; 

cout << endl; 

} 


图 3-4 为 基本 排序 程序 运行 进入 界面 。 


随和 生 所 <1> 急 全 输入 。 <2 自动 生成 


:2 
入 称 需 要 系统 产生 待 排 数据 的 个 数 ，18 
i 


1 467 334 588 169 ?24 478 358 962 464 


请 


3-4 ”基本 排序 程序 运行 进入 界面 


3.5.2 直接 插入 排序 


设想 已 经 有 一 批 排 好 序 的 数据 在 已 排 空间 (在 整个 空间 的 左面 ), 剩 下 的 数据 在 未 排 空 
间 ,每 次 都 固定 取出 待 排 空间 中 * 第 一 个 数据 ,把 它 插 入 到 已 排 空间 正确 位 置 上 去 ,也 就 是 
保持 已 排 空间 依然 是 排序 状态 。 图 3-5 为 直接 插入 排序 (Direct Insert Sorting) 的 原理 示意 
图 和 范例 。 编 程 时 要 注意 每 次 处 理 的 待 排 空间 中 * 第 一 个 数据 ?必须 先 另 外 存储 (例如 可 
以 利用 0 号 单元 ) ,在 数据 移动 后 再 填 人 正确 的 位 置 ,并 不 是 像 虚线 箭头 所 指 那样 直接 捕 
和 的 。 

对 初始 状态 而 言 , 可 以 把 第 一 个 数据 默认 为 已 排 空间 ,因为 仅 一 个 数据 是 没有 所 谓 大 小 
先后 位 置 关系 对 不 对 的 问题 的 ,可 以 认为 它 已 经 有 序 。 然 后 按照 上 述 算法 思路 ,直到 全 部 数 
据 进 入 已 排 空 间 后 排序 结束 。 

本 算法 的 关键 就 是 找到 某 个 数据 的 正确 位 置 , 然 后 把 相关 空间 的 数据 移 开 ,最 后 插入 即 
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[63 01 17 87 05 07] 
C6DD1 17 87 05 0%7】 
C01” 63)[17 87 05 07j 
《01 17<63)[87 05 9 
《01 17 63 8Dl05 07 
Col I 
《01 05 07 63 87) 
图 3-5 直接 插入 排序 的 原理 示意 图 和 范例 


可 ,所 以 命名 为 直接 插 和 排序。 寻找 正确 位 置 的 过 程 可 以 从 前 到 后 ,也 可 以 从 后 向 前 。 由 于 
未 排 空间 在 已 排 空间 的 右边 , 相 比 之 下 建议 从 后 向 前 比较 。 可 以 在 找到 正确 的 位 置 后 ,将 一 
批 数 据 开始 逐个 向 后 移动 。 也 可 以 用 另外 一 个 思路 ,从 后 往 前 ( 即 从 右 至 左 ) 逐 一 比较 ,同时 
移动 数据 。 这 时 需要 注意 的 是 ,需要 把 待 处 理 的 数据 先行 另存 以 备 该 位 置 被 移动 的 数据 覆 
盖 。 如 果 启 用 从 后 往 前 的 比较 方法 , 遇 到 了 相同 的 数据 后 马上 停止 比较 ,此 位 置 即 为 正确 的 
搬入 位 置 , 故 这 个 算法 可 以 写成 稳定 的 程序 。 第 二 种 思路 中 还 可 以 通过 交换 来 达成 排序 的 
效果 。 这 些 都 是 细节 上 的 不 同 , 可 以 通过 计数 比较 和 移动 的 次 数 对 这 几 种 排序 的 细节 差异 
进行 时 间 效率 上 的 评估 。 总 体 来 说 ,启用 交换 数据 必然 大 量 增加 移动 次 数 。 
下 面 为 直接 插入 排序 的 部 分 程序 源码 。 
void list: :directinsertsorting() // 直 接 插入 排序 函数 
{ 
int term; // 指 向 未 排 数 据 的 首位 置 
int i, j,iterm; 
cout <<"【 直 接 插 入 排序 ] 的 排序 过 程 如 下 :"<< endl; 
cout <<" 待 排 数据 如 下 .…"<< endl; 
display(); 


for(term = 0;term< total; term++) 


{ 


cout <<" 第 "<< setw(3)<< term + 1 <<" 个 数据 "<< setw(3)<< data[ term]<<" 插 入 结果 是 :"; 
for(i=0;i<term;i+t+) 
if(data[ i]> data[ term]) 
{ 
iterm = data[ term]; // 保 留 未 排 数 据 首位 置 的 值 
for(j = term;j>i;j--) // 移 动 数据 
data[j] = data[j— 1]; 
data[i] = iterm; // 把 数据 存 人 
break; 
} 
display(); 


. 


由 于 本 算法 启用 了 双 层 嵌 套 循环 , 故 时 间 复 杂 度 为 O(n? ) 。 
图 3-6 为 直接 插入 排序 运行 界面 。 


3.5.3 简单 选择 排序 
简单 选择 排序 (Simple Select Sorting) 的 关键 思路 就 是 求 出 最 小 值 ,第 一 次 只 要 把 整个 
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a 的 排序 过 程 如 下 : 


467 ,334 599 169 ?24 

相 467 334 588 169 724 478 358 962 464 
467 334 589 169 ?24 478 358 962 464 
334 467 588 169 ?24 478 358 962 464 
334 467 569 169 724 478 358 962 464 
962 464 
169 334 467 588 724 478 358 962 464 
169 334 467 478 588 ?24 358 962 464 
169 334 358 467 478 5869 ?24 962 464 


169 334 358 467 478 569 ?724 962 464 
169 334 358 464 467 478 599 724 962 


LA 
全 全 区 让 区 区 站 站 全 全 
四 
加 
~ 
日 
要 
内 
本 


让 接 插入 排序 成 功 ， 
情 按 任意 键 继续 . . . = 
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待 排 空间 的 最 小 值 求 出 来 ,然后 与 第 一 个 数据 交换 位 置 ,这 样 已 排 空间 中 就 有 了 一 个 数据 。 
之 后 对 剩 下 的 待 排 空间 中 的 所 有 数据 重复 该 过 程 ,这 样 次 [ae 0 17 87 o 07] 
小 值 .第 3 个 最 小 值 等 都 求 出 来 了 ,直到 全 部 数据 都 变 成 cf 元 三 抽风 可 
了 已 排 空间 ,排序 完毕 。 (0 oF 6 07] 

由 于 简单 选择 排序 算法 的 原理 与 图 3-3 所 示 的 完全 相 (01 05 o 3 17] 
同 , 此 处 就 不 再 提供 其 原理 示意 图 ,只 通过 一 批 数据 的 排 (ol 05 07 | 
序 过 程 来 说 明 其 原理 (如 图 3-7 所 示 )。 对 于 相同 数据 ,可 《ol 05 07 17 63 [s7] 
以 选择 第 1 个 作为 本 轮 的 最 小 值 数据 先行 处 理 ,那么 相同 Cl 05 om 17 6 87》 
数据 的 相对 位 置 关系 不 会 发 生变 化 , 故 本 算法 也 是 可 以 编 。 图 3-7 简单 选择 排序 范例 
写成 稳定 的 程序 的 。 

下 面 为 简单 选择 排序 的 部 分 程序 源码 。 


void list::simpleselectsorting() // 简 单 选择 排序 函数 
{ 
int term; // 指 向 未 排 数 据 的 首位 置 
int i, iterm, minpos = 0; 
cout <<"【 简 单 选择 排序 ] 的 排序 过 程 如 下 :"<< endl; 
cout <<" 待 排 数 据 为 :"<< endl; 
display(); 
for(term = 0;term< total; term++) 
{ 
iterm = data[ term]; 
for(i= term;i< total;i++) 
if(data[i]<= iterm) 
{ 
iterm= data[ i]; // 保 留 未 排 数 据 最 小 数据 
minpos = i; // 保 留 未 排 数 据 最 小 数据 的 位 置 
} 
data[minpos] = data[ term]; 
data[ term] = iterm; 
cout <<" 第 "<< setw(3)<< term+ 1 <<" 个 数据 到 最 后 一 个 数据 中 "<< setw(3)<< iterm< 
<" 最 小 : "<< endl; 
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display(); 


} 

本 算法 中 数据 移动 量 比较 少 , 但 是 关键 码 比较 次 数 依然 是 双重 循环 所 决定 ,时 间 复 杂 度 
仍 为 O(n?)。 

图 3-8 为 简单 选择 排序 运行 界面 。 


ac 
站 单 法 择 排序 】 的 排序 过 程 如 下 。 
数据 为: 辣 E| 
467 334 S5868 总 324 478 358 962 464 


个 数据 到 最 后 一 个 数据 中 4 最 小 : 


467 334 568 169 324 478 358 962 464 


个 数据 到 最 后 一 个 数据 中 169 最 小 ， 


169 334 569 467 ?24 478 358 962 464 
数 


169 334 358 464 467 598 962 ?724 
个 数据 到 最 居 一 个 各 所 v2 二， ys 
169 334 358 464 467 588 724 962 


个 数据 到 最 后 一 人 数据 中 962 野 ， 枉 


169 334 358 464 467 478 598 ?724 962 


阐 单 选择 排序 成 功 ， 
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3.5.4 冒 泡 排 序 


冒 泡 排序 (Bubble Sorting) 算 法 的 思路 用 它 的 名 字 来 理解 最 恰当 不 过 ,设想 一 批 水 泡 同 
时 上 漂 , 但 是 大 小 不 同 ,肯定 最 大 的 先 漂 上 来 。 约 定 排序 结果 用 从 小 到 大 ,将 从 第 一 个 数据 
开始 向 后 漂 ,成 功 后 最 后 一 个 数据 就 成 为 已 排 空间 ,除了 最 后 一 个 数据 外 的 前 面 所 有 数据 依 
然 是 待 排 空间 ,重复 此 过 程 。 当 然 也 可 以 从 后 面 每 次 往 前 面 漂 出 最 小 值 。 

当前 要 处 理 的 待 排 空间 的 第 一 个 数据 为 “基准 数据 ”, 其 他 数据 为 “对比 数 据 ”, 将 基准 数 
据 依 次 与 下 一 个 对 比 数据 进行 比较 ,如 果 基 准 数据 大 于 对 比 数据 , 则 位 置 发 生 交换 。 关 键 是 
如 果 出 现 基 准 数据 小 于 对 比 数据 时 ,就 要 把 基准 数据 标志 改 为 当前 的 这 个 对 比 数据 ,之 后 ， 
对 于 剩 下 的 待 排 空间 进行 同样 的 工作 。 

[ea o 17 87 0s 0 下 面 通过 第 一 次 漂 出 一 个 最 大 泡 泡 说 明 原理 ( 见 图 0 

[Loe 87 05 07] ”算法 的 结束 并 不 需要 把 所 有 数据 都 漂 一 次 。 如 果 某 一 次 一 

Lor 17 6 87 05 叫 ” 泡 泡 漂 的 过 程 中 没有 发 生 任何 位 置 交 换 排序 六 可 大 个 末 

pF 人 中 如 果 一 开始 数据 的 初始 状态 是 从 小 到 大 ,因为 没有 任何 交换 ， 

Fo 17 @ 05 07 7 显然 一 次 上 漂 就 结束 了 。 在 每 次 冒 泡 的 过 程 中 ,如 果 遇 到 相同 

[o 17 6G 05 oke7) 数据 ,把 后 面 的 对 比 数据 作为 大 的 情况 看 待 , 则 后 面 的 数据 依 

图 3-9 冒 泡 排序 示意 图 。 然 排 在 后 面 .所 以 这 也 是 一 个 稳定 的 排序 方法 。 
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下 面 为 冒 泡 排序 的 部 分 程序 源码 。 
void list::bubblesorting() // 冒 泡 排序 函数 
{ 
int term; // 指 向 已 排 数 据 的 首位 置 


int i, iterm, ii= 0; 
cout <<"【 冒 泡 排 序 3 的 排序 过 程 如 下 :"<< endl1; 
cout <<" 待 排 数 据 为 :"<< endl; 
display(); 
for(term = total — 1;term> 0;term—— ) 
{ 
for(i=1;i<= term;i++) 
if(data[i]<= data[i-1]) 
{ 
iterm= data[i—1]; // 交 换 数 据 
data[i-1] = data[i]; 
data[ i] = iterm; 
} 
cout <<" 第 "<< setw(2)<< total - term<<" 次 冒 泡 :"; 
display(); 


J 


由 于 每 次 冒 泡 都 要 用 到 循环 ,基于 同样 的 思路 ,还 要 对 所 有 数据 都 进行 类 似 操作 ,还 是 
一 个 循环 ,因此 本 算法 依然 采用 的 是 双重 循环 的 嵌 套 , 故 时 间 复 杂 度 仍 为 O(n? ) 。 
图 3-10 为 冒 泡 排序 运行 界面 。 


F] 的 排序 过 程 如 下 : 


334 588 169 ?24 478 358 962 464 
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OO 


3-10” 冒 泡 排序 运行 界面 


3.5.5 单 链表 插入 排序 


直接 插入 排序 会 引发 数据 移动 ,时间 效率 比较 低 。 如 果 希 望 不 移动 数据 就 能 完成 排序 ， 
则 需要 改变 存储 结构 ,例如 使 用 单 链表 插入 排序 (LinkList Insert Sorting)。 单 链表 插入 排 
序 就 是 把 链接 指针 按 关 键 码 的 大 小 实现 从 小 到 大 的 改 链 过 程 ,为 此 需要 增加 一 个 指针 项 。 
这 个 算法 的 思路 与 直接 插入 排序 类 似 .不 同 的 是 直接 插入 排序 时 移动 了 数据 ,而 链表 插入 排 
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序 则 是 修改 了 链接 指针 。 下 面 给 出 单 链表 插入 排序 的 示意 图 (如 图 3-11 所 示 )。 头 指针 
head 引导 的 为 已 经 排 好 序 的 数据 链表 ,newdata 指针 引导 的 为 未 排序 的 数据 ,图 中 只 有 一 
个 ,实际 可 以 有 多 个 数据 。 每 一 次 待 排 空间 的 第 一 个 数据 就 是 要 插 在 正确 位 置 的 新 数据 。 
正确 位 置 就 是 新 数据 插入 后 链表 中 数据 保持 有 序 。 如 果 启 用 链表 结构 ,可 以 直接 编写 出 本 
节 的 程序 。 如 果 某 种 开发 环境 不 容许 使 用 链表 结构 ,但 是 又 感觉 这 种 思路 很 好 , 则 可 以 利用 
数组 来 模拟 这 种 结构 ,此 时 称 为 静态 链表 。 


followp searchp 


| 


Jy Na 
head IAA Hm 2 号 局 | 入 ] newdata 333 
@ 


图 3-11 动态 链表 插入 排序 的 工作 示意 图 


3.6 排序 的 应 用 案例 


【应 用 案例 3-1】 股票 信息 编号 方便 阅读 和 查找 。 

中 国 股市 A 股市 场 已 经 有 几 千 只 股票 ,如 果 只 有 中 文 名 称 则 对 股民 会 带 来 巨大 的 
记忆 和 操作 困难 。 上 海 市 场 和 深圳 市 场 的 股票 已 经 全 部 编号 ,并 且 通 过 “六 位 长 度 ” 处 
理 后 已 经 统一 为 一 个 整体 ,这 样 记忆 股票 就 简单 多 了 。 同 时 为 了 看 盘 方 便 ,所 有 股票 
都 会 按照 编号 从 小 到 大 进行 排序 ,这 样 即使 增加 了 新 的 股票 ,由 于 有 编号 而 且 已 经 排 
序 ,就 很 容易 找到 了 。 通 过 这 个 案例 明显 可 以 看 到 大 批 数据 经 过 排序 后 大 大 增加 了 数 
据 的 易 用 性 。 

【应 用 案例 3-2】 身份 证 编号 使 得 中 国 的 居民 可 以 相互 区 别 。 

现实 生活 中 ,人 名 重复 是 很 普遍 的 现象 。 虽 然 说 人 名 是 标识 一 个 人 的 主要 标志 ,但 如 果 
只 用 人 名 来 管理 人 的 各 种 信息 ,就 会 出 现 很 多 问题 。 解 决 这 个 问题 的 方法 通常 是 增加 一 个 
代码 ,如 工作 证 编号 、 学 生 证 编号 ,在 中 国 最 大 的 编号 体系 就 是 身份 证 编号 。 有 了 这 套 体系 ， 
就 可 以 进行 任何 操作 ,包括 在 一 个 范围 内 对 所 有 人 员 按 编号 排序 。 对 于 提高 查找 效率 将 起 
到 很 大 作用 。 这 个 思想 方法 可 以 举一反三 ,如 设备 编号 产品 编号 等 。 


3.7 本 章 总 结 


本 章 主要 介绍 了 基本 查找 方法 的 4 种 排序 方法 ,用 比较 实用 的 观点 去 体会 线性 表 的 应 
用 。 查 找 算法 在 细节 上 也 有 提升 速度 的 考量 。 排 序 方面 先 给 出 了 一 个 总 的 排序 思路 ,然后 
通过 不 同 的 设计 细节 来 实现 多 种 排序 方法 。 给 出 的 程序 源码 可 以 帮助 读者 更 容易 地 理解 原 
理 和 代码 之 间 的 关系 ,最 后 通过 案例 介绍 了 排序 的 实际 用 途 。 

查找 是 很 多 功能 的 前 提 , 只 有 查 到 了 相关 数据 ,才能 进一步 进行 处 理 。 

排序 也 是 实现 许多 其 他 功能 的 前 提 , 排 序 后 可 以 增加 数据 的 信息 量 。 在 学 习 了 更 多 的 
数据 结构 知识 后 ,就 可 以 学 习 到 更 多 更 好 的 排序 方法 。 本 书后 面 章 节 将 推出 更 多 的 排序 方 
法 供 读者 研究 。 
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习 题 


一 、 原 理 讨 论题 

1. 查找 的 基本 思路 是 什么 ? 它 的 时 间 效 率 如 何 ? 

2. 排序 涉及 的 3 种 基本 操作 是 什么 ? 

3. 常规 的 排序 算法 的 共同 点 是 什么 ? 

4. 排序 的 稳定 性 指 什么 ? 为 什么 要 讨论 它 ? 

5. 排序 可 以 增加 信息 量 吗 ? 试 举例 说 明 。 

二 、 理论 基本 题 

1. 写 出 以 下 概念 的 定义 : 数据 项 组 合 项 ,记录 、 关 键 码 ,查找 表 、 静 态 查 找 表 ,动态 查找 表 。 

2. 夯 出 顺序 查找 的 示意 图 。 

3. 写 出 以 下 概念 的 定义 : 排序 稳定 性 、 主 关键 码 .次 关键 码 。 

4. 给 出 任意 无 序 的 数据 7 个 , 画 出 直接 插入 排序 法 过 程 的 示意 图 (约定 从 小 到 大 ,下 同 ) 。 

5. 给 出 任意 无 序 的 数据 7 个 , 画 出 简单 选择 排序 法 过 程 的 示意 图 。 

6. 给 出 任意 无 序 的 数据 7 个 , 画 出 冒 泡 排序 法 过 程 的 示意 图 。 

三 、 编 程 基本 题 

1. 编程 判断 一 个 线性 表 中 的 数据 是 否 已 经 排 好 序 ( 升 序 ) 。 

2. 在 跑步 成 绩 管 理 系统 中 ,至 少 有 运动员 号 .运动 员 名 、 成 绩 和 名 次 4 项 信息 。 构 造 数 
据 结构 ,同时 存储 这 4 个 数据 项 ,编程 中 约定 运动 员 不 超过 100 名 。 用 菜单 管理 ,并 且 把 个 
人 基本 信息 和 跑步 成 绩 分 开 录入 。 建 议 的 菜单 为 : 录入 运动 员 个 人 信息 、 显 示 运 动员 个 人 
信息 、 修 改 运动 员 个 人 信息 、 插 入 运动 员 个 人 信息 、 删 除 运 动员 个 人 信息 、 录 入 跑步 成 绩 、 统 
计 名 次 .显示 排名 。 程 序 要 求 可 以 反复 运行 。 

3. 编写 程序 ,在 一 个 有 序 的 线性 表 中 删除 重复 的 数据 。 如 (1,2,2,3,3,3,4,5,5,6) 会 
化 简 为 (1,2,3,4,5,6)。 

4. 编写 程序 ,把 两 个 有 序 表 合并 成 一 个 有 序 表 , 并 且 删 除 其 中 重复 的 数据 。 如 (1,2,3,4) 
和 (3,4,5,6) 会 化 简 为 (1,2,3,4,5,6)。 存 储 结构 可 以 分 别 使 用 顺序 表 和 单 链表 。 

四 、 编 程 提高 题 

1. 请 采用 以 下 思路 来 进行 排序 编程 ,分 别 统计 出 小 于 每 个 数据 的 数据 个 数 , 利 用 数组 
下 标 从 0 开始 直接 得 到 所 有 数据 的 正确 地 址 。 讨 论 这 个 算法 适合 有 相同 数据 的 情形 。 

2. 改进 本 书 中 3 种 排序 程序 ,加 入 统计 交换 数据 的 次 数 或 者 移动 数据 的 次 数 功能 并 且 
对 照 显示 。 

3. 编程 实现 静态 链表 插入 排序 。 

五 、 思 考题 

1. 对 于 十 进 制 的 数值 进行 排序 是 相对 容易 理解 的 ,但 是 使 用 计算 机 处 理 信息 时 ,还 会 
遇 到 文字 等 其 他 信息 ,那么 对 于 英文 字 串 、 中 文字 串 , 是 否 能 够 排序 呢 ? 它 们 的 比较 规则 是 
什么 呢 ? 试 推荐 一 种 你 设计 的 比较 规则 。 

2. 读者 能 和 否 自己 研究 出 一 种 排序 算法 并 且 编程 实现 ? 

3. 能 否 不 比较 数据 而 进行 排序 ? 
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本 章 主要 介绍 第 二 种 数据 结构 一 一 栈 。 它 是 一 种 特殊 的 线性 结构 ,本 章 介绍 它 的 逻辑 
结构 ,存储 结构 ,存储 结构 包括 顺序 栈 和 链 栈 两 种 实现 方式 ,并 且 给 出 栈 相关 基本 操作 的 程 
序 设计 。 栈 可 以 用 来 解决 许多 编程 中 遇 到 的 难题 ,本 书后 面 的 许多 数据 结构 相关 程序 设计 
中 也 需要 栈 结构 来 支撑 。 


4.1 引 言 


先 来 观察 一 下 现实 生活 中 的 一 些 现象 。 如 餐馆 洗 碗 工 洗 盘子 时 总 会 把 洗 干 净 的 盘子 放 
在 一 操 盘 子 的 最 上 面 ,而 做 菜 的 师傅 使 用 盘子 时 总 是 拿 最 上 面 一 个 。 又 如 手枪 的 子弹 夹 , 虽 
然 它 的 顶部 不 动 而 是 底部 的 弹簧 在 变化 高 度 , 但 是 对 于 子弹 来 说 , 却 是 最 后 一 个 压 进去 的 被 
第 一 个 击发 出 去 。 这 种 特性 被 称 为 “后 进 先 出 ”。 

本 章 通过 对 第 2 章 介绍 的 线性 表 的 改造 对 数据 "后 进 先 出 ”特性 进行 处 理 , 主 要 是 对 线 
性 表 的 插入 和 删除 操作 增加 约束 条 件 。 约 束 条 件 为 只 能 在 线性 表 固 定 的 一 端 进 行 插入 和 删 
除 ,这 将 构成 “ 栈 ”, 栈 具有 “后 进 先 出 "的 性 质 。 


4.2 栈 的 逻辑 结构 
栈 (Stack) 是 限制 在 特定 一 端 进行 插入 和 删除 操作 的 线性 表 。 人 允许 插入 、 删 除 的 这 一 端 


称 为 栈 顶 ; 另 一 个 固定 端 称 为 栈 底 ; 当 表 中 没有 元 素 时 称 为 空 栈 。 
栈 的 概念 来 自 于 早期 火车 掉头 的 一 种 实现 方式 。 图 4-1 所 示 为 火车 通过 栈道 进行 掉头 


的 工作 原理 。 显 然 最 后 进入 栈道 的 车 厢 最 先 退 出 栈道 。 
持 


> 


从 左 往 右 开 开 入 栈道 退出 栈道 从 右 往 左 开 
图 4-1 火车 利用 栈道 掉头 的 工作 原理 示意 图 


第 4 章 栈 的 构造 与 应 用 


“后 进 先 出 ”的 英文 为 Last In First Out, 所 以 栈 也 被 称 为 LIFO 表 , 这 种 性 质 在 程序 设 
计 中 将 起 到 基础 和 至 关 重 要 的 作用 。 

栈 的 实现 可 以 通过 不 同 的 存储 结构 来 完成 ,在 建立 的 过 程 中 就 要 先 确定 使 用 哪 种 存储 
结构 ,如 果 是 顺序 存储 ,开始 就 要 确定 栈 的 大 小 。 在 空间 使 用 完毕 时 就 会 达到 栈 满 的 状态 ， 
再 进 栈 的 话 就 会 产生 “上 溢 ” 的 错误 提示 信息 。 使 用 链接 结构 , 则 不 需要 先行 设计 空间 大 小 。 
只 要 在 申请 空间 时 操作 系统 能 返回 可 以 使 用 的 地 址 ,就 没有 “上 溢 ” 的 问题 。 

在 具体 实现 栈 的 过 程 中 ,要 注意 栈 顶 并 不 是 一 个 固定 的 地 址 ,如 数组 的 边界 下 标 。 栈 顶 
的 位 置 是 随 着 进 栈 的 数据 量变 化 的 。 为 了 记录 实际 的 栈 顶 ,约定 用 一 个 变量 top 来 指向 
栈 顶 。 

如 果 需 要 可 以 显示 栈 中 所 有 数据 ,但 是 这 可 以 理解 为 线性 表 的 基本 操作 , 故 不 列 在 下 面 
的 操作 清单 中 。 

栈 的 主要 操作 清单 见 表 4-1。 


表 4-1 栈 的 主要 操作 清单 


操作 名 称 建议 函数 名 称 编程 细节 约定 

栈 初始 化 eC ic ei size 是 空间 的 大 小 ,不 需要 时 
销毁 栈 destroy(stack) 释放 栈 所 占 的 空间 

判 栈 空 isempty(stack) 车 stack 为 空 栈 返回 1, 否 则 返回 0 

判 栈 满 isfull( stack) 若 stack 为 满 栈 返回 1, 否 则 返回 0 

进 栈 es RE 部 插入 一 个 新 元 素 newdata, newdata 成 为 
出 栈 pop(stack) 将 栈 stack 的 顶部 元 素 从 栈 中 删除 , 栈 中 少 了 一 个 元 素 

读 栈 顶 元 素 gettop(stack) 将 栈 顶 元 素 作为 结果 返回 , 栈 顶 指针 不 变化 


例 4-1 进 栈 操作 约定 用 push 表示 ,出 栈 操作 用 pop 表示 。 假 设 对 于 数据 (1,2,3), 约 
定 从 左 到 右 的 次 序 用 栈 依次 处 理 一 次 , 即 进 栈 一 次 ,出 栈 一 次 。 如 果 操 作 序列 为 : push、 
push、push、pop、pop、pop;: 输 出 序列 是 (3,2,1), 也 就 是 原 序 列 的 逆序 。 如 果 操 作 序 列 为 : 
push、pop、push、pop、push、pop;, 输 出 序列 是 (1,2,3), 也 就 是 原 序 列 。 如 果 是 push、push、 
pop、pop、push、pop;, 输 出 的 序列 则 是 (2,1,3)。 

有 些 操作 序列 是 不 可 能 的 ,如 : push、pop、pop、push、pop、push, 因 为 第 一 次 出 栈 后 当 
前 栈 为 空 ,没有 数据 可 以 出 栈 , 也 就 是 会 提示 出 错 信息 “下 溢 ”。 

还 有 一 些 输 出 序列 也 不 可 能 ,如 (3.1,2)。 因 为 要 输出 3, 必 须 先 将 1.2、3 依次 人 栈 ,3 
出 栈 之 后 2 在 栈 顶 而 1 并 不 在 栈 顶 ,按照 “后 进 先 出 ?的 性 质 ,1 不 可 能 出 栈 。 


4.3 栈 的 顺序 存储 


栈 的 第 一 种 存储 方案 是 顺序 存储 ,用 顺序 存储 结构 实现 的 栈 称 为 “顺序 栈 ”。 
类 似 于 顺序 表 , 栈 中 的 数据 元 素 依次 放 在 一 片 连续 的 空间 中 。 为 了 便于 算法 设计 ,编程 
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时 通常 都 是 用 一 维 数组 来 实现 ,由 于 栈 中 的 数据 量 不 断 变 化 ,通常 数组 的 申请 空间 大 小 需要 
考虑 这 个 因素 ,不 浪费 空间 的 同时 也 尽量 不 要 出 现 上 溢 的 情况 。 栈 底 位 置 建议 设置 在 数组 
的 最 低下 标 , 也 就 是 下 标 0, 启 用 变量 top 作为 栈 项 指针 ,指向 当前 栈 项 位 置 , 栈 顶 指针 随 着 
进 栈 和 出 栈 操作 变化 ,在 数组 这 个 层面 就 是 top 十 十 或 top 一 一 ,为 了 统一 编程 中 空 栈 和 栈 
中 有 数据 情况 下 的 两 种 语句 ,建议 把 top 的 初 值 赋 为 一 1, 用 于 代表 空 栈 。 

图 4-2 假设 一 个 空间 大 小 为 7 的 数组 stackspace, 其 中 有 3 个 数据 (111,222,333) 已 被 
压 人 栈 , 之 后 再 进行 进 栈 操作 ,数据 item 为 444。 图 4-2(c) 是 相对 于 图 4-2(a) 出 栈 的 示 
意图 。 


MaxSize-1 6 6 
5 5 
4 4 
3 3 
top —>2['! 333!1 2| 333 
1 222 top—>1|!! 222! 1 
0 111 0 111 
(a) 初始 状态 (b) 相对 初始 状态 进 栈 444 的 效果 (0) 相对 初始 状态 进 栈 333 的 效果 


4-2 ”顺序 栈 的 进 栈 、 出 栈 示意 图 


由 于 在 顺序 存储 中 栈 顶 指针 约定 指向 实际 栈 项 元 素 , 故 进 栈 操作 编程 时 应 该 把 栈 项 指 
针 先 加 1 产生 最 新 的 栈 顶 位 置 (top 二 top 十 1, 即 top 十 十 ), 然 后 存 人 数据 (stackspace[Ltop] 一 
item;)。 注 意 这 两 个 操作 有 次 序 相关 性 ,不 能 颠倒 (在 编程 时 可 以 合并 为 一 个 语句 ,如 
stackspace[ 十 十 topj] 二 item;); 出 栈 时 只 需 把 栈 顶 指针 减 1 即 可 (top 二 top 一 1, 即 top 一 一 )。 根 
据 内 存 的 特性 ,出 栈 操作 完成 后 下 标 2 的 位 置 实 际 上 原来 那个 数据 ( 即 333) 还 在 ,并 不 会 变 
成 空白 。 这 个 数据 已 经 在 top 指向 的 栈 项 地 址 之 外 ,所 以 它 已 经 不 属于 栈 中 的 数据 了 ,下 次 
进 栈 时 可 以 用 新 的 数据 覆盖 它 并 使 用 这 个 位 置 。 在 画 示意 图 的 时 候 可 以 不 画 这 些 已 经 出 栈 
的 数据 。 

【程序 源码 4-1】 顺序 栈 的 功能 演示 。 由 于 栈 的 相关 操作 都 是 基础 操作 ,会 在 以 后 的 
程序 设计 中 用 到 ,所 以 相关 函数 内 部 最 好 不 要 有 任何 输入 和 输出 的 过 程 或 语句 。 需 要 处 理 
的 数据 的 输入 过 程 和 结果 的 输出 都 在 函数 外 面 完成 。 本 次 数组 采用 动态 数组 而 不 是 静态 数 
组 ,所 以 有 一 次 临时 通过 用 户 输 入 的 数组 大 小 进行 申请 空间 的 过 程 。 由 于 今后 进 栈 的 数据 
不 一 定 是 整数 的 数据 ,所 以 这 里 开发 的 是 利用 模板 来 设计 顺序 栈 的 程序 , 它 的 好 处 是 将 来 调 
用 时 才 临 时 告知 需要 进 栈 的 是 什么 数据 类 型 ,这 样 就 大 大 提高 了 程序 的 通用 性 ,不 过 刚 学 习 
设计 时 有 一 定 的 困难 ,所 以 下 面 给 出 了 完整 的 程序 源码 。 

// 功 能 :顺序 栈 的 功能 演示 

# include < stdlib. h> 

# include < conio.h> 

# include < string.h> 

# include < iostream.h> 

// 以 下 为 栈 数据 结构 定义 部 分 ,如 果 用 工程 建立 程序 ,可 以 另外 存 和 文件 seqstack.h 

// 模 板 顺 序 栈 类 seqstack 的 定义 说 明 


template < class TYpe> class seqstack{ 
public: 
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seqstack( ); // 创 建 一 个 空 栈 
seqstack( int size); // 创 建 一 个 可 以 容纳 size 个 元 素 的 栈 
~seqstack( ); // 销 毁 一 个 栈 
bool create( int size); // 实 际 创建 一 个 可 以 容纳 size 个 元 素 的 栈 
void destroy(); // 销 毁 一 个 栈 
bool isempty() const; // 确 定 栈 是 否 已 空 
bool isfull() const; // 确 定 栈 是 否 已 满 
bool push(Type & item) ; // 数 据 进 栈 
bool pop(); // 数 据 出 栈 
bool pop(TYpe & item) ; // 数 据 出 栈 并 返回 出 栈 前 的 栈 顶 
bool gettop(Type & item) ; // 取 出 当前 栈 顶 数据 
void display(); // 显 示 栈 的 所 有 元 素 
Private: 
Type * stackspace; // 指 向 栈 
int stacksize; // 栈 的 大 小 , 当 为 0 时 , 栈 没有 创建 空间 
int top; // 栈 顶 位 置 , 当 为 - 1 时 , 栈 为 空 


}; 
// 以 下 为 栈 数据 结构 实现 部 分 ,如 果 用 工程 建立 程序 , 可 以 另外 存 人 文件 seqstack. cpp 
template < class Type> 
seqstack < Type >: :seqstack() 
{ 
stackspace = NULL; 
stacksize = 0; // 栈 的 大 小 , 当 为 0 时 , 栈 没 有 创建 空间 
top= -1; // 栈 顶 位 置 , 当 为 - 1 时 , 栈 为 空 
i 
template < class Type> 
seqstack < Type >: :seqstack( int size) 
{ 
stackspace = NULL; 
stacksize = 0; 
top= 一 17 
create( size); 
} 
template < class Type> 
seqstack < Type >: :~ seqstack() 
{ 
destroy( ); 
} 
template < class Type> 
bool seqstack < Type >::createl( int size) 
{ 


if(stacksize) // 栈 已 经 存在 ,不 能 再 创建 
return false; 
if(size<=0) //size 的 值 必须 大 于 零 


return false; 

stackspace = new Type[ size]; 

if(!stackspace) // 没 有 申请 到 存储 空间 ,创建 栈 不 成 功 
return false; 

stacksize = size; 

top= —1; 

return true; 


67 > 


用 C++ 实现 数据 结构 程序 设计 


} 
template < class Type> 
void seqstack < Type >: :destroy() 


{ 
if(stackspace) 
delete [] stackspace; 
stackspace = NULL; 
stacksize= 0; 
top= —1; 
} 


template < class Type> 
bool seqstack < Type >::isempty() const 
{ 
if(!stacksize) // 确 定 栈 是 否 被 创建 
return true; 
return top>= 0 ? false : true ; 
} 
template < class Type> 
bool seqstack < Type >::isfull() const 
{ 
if(!stacksize) // 确 定 栈 是 否 被 创建 
return true; 
return top == stacksize 一 1 ? true : false; 
template < class Type> 
bool seqstack < Type>: :push(Type & item) 
{ 


if(!stacksize) // 确 定 栈 是 否 被 创建 
return false; 
if(isfu11()) // 确 定 栈 是 否 装 满 
return false; 
stackspace[ ++top] = item; // 此 处 先 执行 栈 顶 指针 往 上 移动 ,然后 再 把 数据 放 入 其 中 


// 此 处 约定 top 始终 指向 真正 的 栈 顶 
return true; 

’ 

template < class Type> 

bool seqstack < Type>: :pop() 


' 
if(isempty()) // 确 定 栈 是 否 为 空 
return false; 
top——; // 出 栈 只 需要 把 栈 项 指针 往 下 移动 
return true; 
} 


template < class Type> 
bool seqstack < Type>::pop(Type & item) 
{ 
if(isempty()) 
return false; 
item = stackspace[ top —— ]; // 把 数据 返回 去 ,之 后 把 栈 顶 指针 往 下 移动 


return true; 
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template < class Type> 
bool seqstack < TYpe>: :gettop(TYpe & item) 


} 


if(isempty()) 

return false; 
item = stackspace[ top]; 
return true; 


template < class Type> 
void seqstack < Type >: :display() 


L 
if(stacksize) 
{ 
cout <<" 目 前 栈 中 的 内 容 是 :"; 
cout <<" 栈 底 国 "; 
for(int i=0;i<= top;i++) 
cout << stackspace[ i]<<" "; 
cout <<"<-top 栈 顶 "<< endl; 
} 
else 
cout <<" 栈 尚未 建立 ! "<< endl; 
// 主 程序 开始 


void main(void) 


{ 


system( "color £0"); 


SetConsoleTitle(" 顺 序 栈 的 功能 演示 "); /设置 标题 


seqstack < int > stacknow; 
char yesno, userchoice = '9'; 
int newstacksize, datain, dataout; 
while(1) 
{ 
if(userchoice == '9') 
{ 


system("cls"); 


// 先 进行 一 次 清 屏 
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COUH <<" 关 关 尖 关 关 关 尖 尖 尖 尖 尖 尖 关 关 关 关 关 关 闫 甘美 关 关 关 关 尖 尖 尖 关头 关 关 关 关 关 关 关 关 关 "<< End] 7 


Cout <<" x% 顺序 栈 的 功能 演示 x# "<< endl; 
COUt <<" 关 尖 关 关 关 关 尖 关 美美 尖 关 关 关 关 关 关 关 关 关 关 关 关 关 关 关 关 关 关 关 关 关 关 关 关 关 关 关 关 "<< end];》 
Cout <<" 关 关 1: 创建 一 个 栈 xx "<< endl; 
Cout <<" xx 2: 销毁 一 个 栈 关 # "<< endl; 
Cout <<" 关 关 3: 数据 进 栈 xx "<< endl; 
Cout <<" xx 4: 数据 出 栈 xx "<< endl; 
Cout <<" 关 关 5: 显示 栈 中 全 部 数据 关 关 "<< endl; 
Cout <<" xx 6: 读 取 栈 顶 数据 x "<< endl; 
Cout <<" 关 关 7: 判断 是 否 空 栈 关 关 "<< endl; 
Cout <<" 关 关 8: 判断 是 否 满 栈 x¥ "<< endl; 
Cout <<" 关 关 9: x*xx 清 屏 xxx x¥ "<< endl; 
Cout <<" 关 关 0: 退出 x¥x "<< endl; 


COUt <<" 尖 关 闪闪 关 关 关 关 关 关 关 关 关 关 关 尖 关 关头 关 关 关 关 关 尖 关 关 关 关 关 关头 关 关 关 关 关 关 关 "<< end] 7 


} 
cout <<" 请 选择 :"; 
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cin>> userchoice; 


if(userchoice == '0') // 退 出 程序 
break; 
switch(userchoice) 
{ 
case '1': // 必 须 先 创 建 一 个 栈 , 才 能 压 人 数据 


cout <<" 开 始 创建 栈 , 请 输入 栈 空间 大 小 :"; 
cin>> newstacksize; 
if(stacknow. create(newstacksize)) 
cout <<" 创 建成 功 , 栈 空间 大 小 是 :"<< newstacksize << endl; 
else 
cout <<" 创 建 失败 !"<< endl; 
break; 
Case '2°': // 销 毁 一 个 栈 
cout <<" 你 真 的 要 销毁 栈 吗 ?请 输入 (Y/N) 确 定 :"; 
cin>> yesno; 
if(yesno== 'Y'||yesno == 'y') 
' 
stacknow. destroy( ); 
cout <<" 栈 已 经 销毁 !"<< endl; 
} 
break; 
Case '3': // 把 数据 压 入 栈 
cout <<" 向 栈 压 人 数据 :"; 
cin>> datain; 
if(stacknow. push(datain)) 
{ 
cout <<" 数 据 "<< datain <<" 已 成 功 进 栈 !"<< endl; 
stacknow. display( ) ; 
} 


else 
cout <<" 数 据 "<< datain <<" 进 栈 失 败 !"<< end]l; 
break; 
case '4': // 从 栈 中 弹出 数据 


if(stacknow. pop(dataout)) 
{cout <<" 从 栈 中 成 功 地 弹出 数据 :"<< dataout << endl1; 
stacknow. display( ); 
} 
else 
cout <<" 出 栈 操作 失败 "<< end]l; 
break; 
Case '5': 
stacknow. display( ); 
break; 
case '6': 
if(stacknow. gettop(dataout) ) 
{cout <<" 栈 顶 数 据 为 :"<< dataout << endl; 
stacknow. display( ); 


else 


cout <<" 取 栈 顶 数据 操作 失败 "<< endl; 
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break; 
case 7': // 栈 是 否 已 空 
if(stacknow. isempty()) 
cout <<" 目 前 是 空 栈 或 者 栈 尚未 建立 . "<< end]l; 


else 
cout <<" 目 前 是 非 空 栈 . "<< endl; 
break; 
case '8': // 栈 是 否 已 满 


if(stacknow. isfull()) 
cout <<" 目前 是 满 栈 或 者 栈 尚未 建立 . "<< endl; 
else 
cout <<" 目 前 栈 不 满 , 还 可 以 继续 进 栈 . "<< endl; 
break; 
case '9': 
break; 
default: 
cout <<" 对 不 起 ,输入 命令 有 错 !"<< endl; 
break; 


} 
图 4-3 为 顺序 栈 运行 后 的 部 分 界面 效果 。 
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4-3 ”顺序 栈 运行 后 的 部 分 界面 效果 


时 间 效 率 评价 : 对 于 栈 来 说 ,由 于 进 栈 和 出 栈 都 在 栈 项 位 置 (或 相 邻 一 个 单元 ) 进 行 , 所 
以 即使 使 用 了 顺序 存储 结构 ,也 没有 引起 数据 的 移动 。 在 上 面 所 有 函数 中 ,只 有 遍历 栈 中 所 
有 元 素 的 操作 是 O(n) 的 时 间 复 杂 度 ,其 他 的 都 是 O(1) 级 的 。 
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4.4 栈 的 链接 存储 


栈 的 第 2 种 存储 方案 采用 单 链表 结构 ,用 链接 存储 结构 实现 的 栈 称 为 “ 链 栈 ”。 链 栈 的 
结 点 结构 与 线性 链表 的 结 点 结构 相同 ,可 以 定义 如 下 : 


struct stacknode // 定 义 一 个 结构 体 
{ 

int data; 

stacknode * next; 

}; 

为 了 区 别 顺序 栈 , 此 处 的 栈 顶 指针 改 为 linkStackTop。 因 为 进 栈 、 出 栈 操 作 总 是 在 栈 顶 
一 端 ,如 果 把 linkStackTop 设计 在 链 的 尾部 , 进 栈 可 以 做 到 ,出 栈 就 很 困难 ,所 以 把 单 链表 
的 头 指针 直接 作为 栈 顶 指针 较 好 。 

和 线性 链表 类 似 , 为 了 防止 空 栈 的 特殊 情况 给 算法 设计 带 来 不 便 , 可 以 约定 链 栈 带 有 头 
结 点 ,如 图 4-4 所 示 。 


lnkStackTop HHA 村 33T[ 拉 ?Pm I 人 ] 


图 4-4 带 有 头 结 点 的 链 栈 示意 图 


此 处 的 linkStackTop 没有 直接 指向 逻辑 上 的 栈 顶 元 素 , 而 是 通过 linkStackTop-> 
next 来 完成 对 实际 栈 顶 元 素 的 指向 ,所 以 程序 设计 中 某 些 语句 的 正确 性 也 会 依赖 这 样 的 
约定 。 

例如 有 头 结 点 的 情况 下 ,搜索 指针 的 初始 化 状态 就 应 该 在 头 指针 的 直接 后 继 结 点 位 置 
( 即 searchp = linkStackTop-> next), 而 没有 头 结 点 的 情况 下 ,初始 化 应 该 为 searchp = 
linkStackTop。 下 面 的 程序 源码 4-2 采用 了 启用 头 结 点 的 单 链表 。 

图 4-5 是 链 栈 的 进 栈 操作 示意 图 ,被 打 叉 的 指针 是 原来 的 状态 , 进 栈 操作 改 链 后 修改 过 
的 指针 用 带 圈 的 标号 指明 其 次 序 。 


linkStackTop 333 222 111 | 和 


newnodep 444 (0 
4-5 ” 链 栈 的 进 栈 操作 示意 图 
图 4-6 是 链 栈 的 出 栈 操 作 示意 图 ,其 中 没有 画 出 释放 usedNodep 所 指向 空间 的 过 程 。 
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图 4-6 链 栈 的 出 栈 操作 示意 图 
考虑 到 降低 编程 的 难度 ,本 程序 源码 没有 使 用 模板 。 下 面 的 源码 主要 是 进 栈 和 出 栈 的 


【程序 源码 4-2】 链 栈 的 功能 演示 。 


// 功 能 : 链 栈 的 功能 演示 [ 非 类 模板 格式 】 
# include < stdlib.h> 
# include < stdio.h> 


# include < conio.h> 


# include < iostream.h> 


# include < windows.h> 


# include < string.h> 
class linkstack; 
class linkstacknode 


{ 


friend class linkstack; 


private: 


}; 


linkstacknode( linkstacknode * nextp= NULL); 
linkstacknodel( int &newdata , linkstacknode * nextp = NULL); 
int data; 

linkstacknode * next; 


class linkstack 


{ 


public: 


linkstack( ); 

一 Linkstack(); 

void destroy(); 

bool isempty() const; 

int getlength( ) const; 

bool push( int &item) ; 

bool pop(); 

bool pop(int &item); 

bool gettop(int &item) const; 
void display(); 


private: 


}; 


linkstacknode * newnode(linkstacknode * nextp = NULL); 
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// 对 象 链 栈 的 说 明 


// 申 请 友 元 类 


// 构 造 函 数 

// 构 造 函 数 

// 数 据 元 素 

// 递 归 定 义 指向 后 继 结 点 的 
// 指 针 


// 创 建 一 个 空 栈 


// 销 毁 一 个 栈 

// 确 定 栈 是 否 已 空 

// 获 取 栈 中 元 素 的 个 数 
// 把 数据 压 进 栈 

// 把 数据 弹出 栈 


// 取 出 栈 顶 数据 
// 显 示 栈 的 所 有 元 素 


linkstacknode * newnode( int &item ,linkstacknode * nextp = NULL); // 创 建新 的 结 点 


linkstacknode * linkstacktop; 
int linkstacklength; 


bool linkstack: :push( int &item) 


{ 


linkstacknode * newnodep; 


newnodep = newnode( item, linkstacktop); 


if(!newnodep) 
return false; 


linkstacktop = newnodep; 


// 数 据 进 栈 


// 定 义 指针 newnodep 准备 指向 
// 申 请 的 新 结 点 

// 申 请 新 结 点 ,把 数据 存 人 ,把 
// 指 针 域 指向 头 指针 四 


// 如 果 没 有 申请 到 空间 ,返回 
// 失 败 
// 改 链 ,完成 进 栈 @ 
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linkstacklengtht++; 


return true; 


} 


bool linkstack: :pop(int &item) 


{ 


linkstacknode * usednodep; 


if(!isempty()) 


{ 


’ 


usednodep = linkstacktop; 
linkstacktop = linkstacktop— > next; 
item = usednodep 一 > data; 

delete usednodep; 
inkstacklength——; 


return true; 


return false; 


} 


图 4-7 为 链 栈 运行 


后 的 部 分 界面 效果 。 


人 


二 提 汪汪 手提 


人 
内 容 : 栈 顶 -> 22 11 国 栈 底 


惟 备 进 栈 的 数据 ;33 
EN 22 11 国 材 底 
ee 11 轿 栈 底 


图 4-7 链 栈 运行 后 的 部 分 界面 效果 


// 栈 的 长 度 增加 
// 本 次 操作 成 功 


// 出 栈 , 把 栈 顶 数据 返回 去 


// 定 义 指针 usednodep 准备 指 
// 向 出 栈 的 结 点 
// 判 断 是 否 栈 空 


// 指 向 出 栈 的 结 点 四 

// 栈 顶 指 针 后 移 四 

// 把 数据 保留 下 来 ,返回 去 
// 释 放空 间 @@ 

// 栈 的 长 度 减 少 

// 本 次 操作 成 功 


// 否 则 本 次 操作 失败 


时 间 效 率 评价 : 链表 的 特点 就 是 不 用 移动 数据 可 以 进行 插入 和 删除 ,对 于 栈 来 说 ,由 于 
进 栈 和 出 栈 都 在 栈 顶 位 置 (或 下 一 个 结 点 ) 进 行 , 所 以 使 用 链表 存储 结构 ,更 不 会 引起 数据 移 
动 。 在 上 面 所 有 函数 中 ,只 有 遍历 栈 中 所 有 元 素 的 操作 是 O(n) 的 时 间 复 杂 度 ,其 他 的 都 是 


O(C1) 级 的 。 
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4.5 栈 的 应 用 案例 


栈 作 为 数据 结构 ,其 主要 用 途 是 产生 逆序 数据 。 如 象棋 程序 设计 中 需要 设计 悔 棋 功能 ， 
就 必须 记录 双方 所 有 已 经 下 过 的 步骤 ,一 旦 悔 棋 发 生 , 悔 棋 的 次 序 和 原来 下 棋 的 次 序 正好 相 
反 , 所 以 就 需要 产生 逆序 数据 了 。 栈 的 第 二 大 用 途 是 用 来 保护 现场 ,如 迷宫 程序 设计 中 , 老 
鼠 需要 不 断 尝 试 各 种 没有 去 过 的 路 径 ,而 在 到 达 死 路 一 条 时 就 需要 按照 原 路 回 退 ,而 回 退 的 
编程 机 制 就 是 要 保护 现场 。 

【应 用 案例 4-1】 数 制 转换 问题 。 计 算 机 内 部 采用 二 进 制 表 示 数 据 ,所 以 必须 解决 二 
进 制 和 十 进 制 相互 唯一 性 的 转换 问题 。 在 汇编 语言 编程 中 ,还 会 出 现 八进制 .十 六 进 制 等 ， 
都 有 需要 转换 的 问题 。 以 下 为 把 十 进 制 转换 为 其 他 进 制 的 方法 , 即 辊 转 相 除 法 。 

启用 除法 ,把 十 进 制 数 作为 被 除数 ,把 要 转换 的 进 制 数 作为 除数 ,把 余数 记录 下 来 ,然后 
把 商 作为 被 除数 ,如 此 反复 直到 不 能 再 除 为 止 ,所 有 余数 就 是 结果 ,但 是 次 序 正好 和 希望 的 
相反 ,所 以 必须 设法 产生 逆序 。 启 用 栈 后 就 可 以 得 到 正确 的 结果 。 但 是 程序 设计 中 必须 注 
意 在 屏幕 上 显示 逆序 只 是 表面 现象 ,要 把 出 栈 后 的 多 个 数字 转换 为 一 个 真正 的 数字 ,还 要 其 
他 算法 配合 才 行 。 小 数 部 分 的 算法 设计 和 整数 不 相同 。 整 数 部 分 的 转换 过 程 如 图 4-8 所 
示 , 可 以 看 出 依次 出 栈 , 即 (3467)io 一 (6613)s 。 


433 54 6 0 stackarray 

8/ 3467 8/ 433 8/ 54 8/ 6 6 
M 32 Y 40 / 48 Y 0 5 
267 33 6 6 4 

24 32 We | top —>3 6 

27 Te 2 

24 2 1 1 

0 3 

(a) 驾 转 相 除法 的 过 程 (b) 进 栈 的 数据 


图 4-8 利用 栈 解决 数 制 转 换 示 意图 


【应 用 案例 4-2】 函数 调用 机 制 的 实现 。 模 块 化 程序 设计 的 思想 主要 体现 在 逐步 求 精 
和 分 而 治之 ,在 高 级 语言 中 实现 的 机 制 分 别 有 子 程序 .过 程 和 函数 等 ,C 语言 中 就 是 使 用 函 
数 。 因 为 函数 被 调用 时 的 位 置 都 是 随机 的 ,返回 地 址 也 就 是 不 固定 的 ,所 以 不 可 能 在 函 
数 中 把 返回 点 直接 写 入 ,而 且 一 个 函数 可 能 在 不 同 的 位 置 被 多 次 调用 ,因此 也 更 不 可 能 
在 函数 中 直接 写 人 返回 地 址 ,这 也 是 为 什么 所 有 函数 的 最 后 都 有 return 语句 ,虽然 可 以 
返回 数据 ,但 是 却 没 有 返回 地 址 的 任何 信息 。 当 调用 关系 很 多 而 且 很 复杂 时 就 很 难 编程 
进行 管理 。 

函数 调用 关系 的 复杂 性 在 于 它们 之 间 有 父子 关系 ( 嵌 套 调用 ) 和 兄弟 关系 (一 个 函数 调 
用 结束 返回 后 才 会 出 现 另 外 一 个 调用 ) 而且 可 以 多 层 调 用 。 仅 通过 算法 设计 很 难 解决 这 个 
问题 ,因为 其 中 返回 地 址 信息 的 关系 很 难 控制 。 返 回 地 址 就 是 一 种 “后 进 先 出 ”的 数据 关系 ， 
一 旦 启用 栈 , 这 个 难题 将 会 迎刃而解 。 除 了 栈 作为 数据 结构 外 ,算法 处 理 规则 为 : 当 出 现 调 
用 时 把 返回 点 进 栈 , 当 遇 到 返回 语句 时 则 出 栈 , 出 栈 的 数据 就 是 正确 的 返回 点 。 如 图 4-9 所 
示 , 栈 对 应 左边 示意 图 画 圆圈 的 地 方 , 可 以 看 到 返回 点 正好 是 上。 
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stackarray 

1----] 一 
人 -一 -1 Te + 
BF or f=] ;TT 
Se op >2 | 
ct 上 5 | 
Es o 心 | 


4-9 函数 调用 机 制 的 实现 示意 图 


实现 递归 机 制 也 会 出 现 类 似 问题 , 故 必须 用 栈 来 管理 。 从 本 质 上 说 递归 调用 与 一 般 函 数 
调用 并 没有 区 别 , 约 定 在 每 次 调用 时 将 属于 各 个 递归 层次 的 信息 组 成 一 个 活动 记录 (Activity 
Record) ,这 个 记录 中 包含 着 本 层 调用 的 实 参 ,返回 地 址 、 局 部 变量 等 信息 ,并 将 这 个 活动 记录 
保存 在 系统 的 “递归 工作 栈 ” 中 ,每 当 递归 调用 一 次 就 在 栈 顶 建立 一 个 新 的 活动 记录 ,一 旦 本 次 
调用 结束 就 将 栈 顶 活动 记录 出 栈 ,根据 获 得 的 返回 地 址 信息 返回 到 本 次 的 调用 处 。 


4.6 本 章 总 结 


本 章 主要 介绍 栈 的 逻辑 结构 ,存储 结构 和 基本 操作 的 程序 设计 。 通 过 图 示 和 讨论 ,展示 
栈 的 工作 原理 ,给 出 了 多 个 应 用 案例 。 许 多 问题 仅 通过 算法 技巧 不 容易 解决 ,但 是 启用 栈 这 
种 数据 结构 后 很 难 的 问题 都 能 迎刃而解 。 

通常 情况 下 使 用 数组 实现 栈 就 可 以 了 ,因为 栈 的 操作 并 不 需要 引起 数据 移动 ,但 是 如 果 
经 常 溢出 , 则 可 以 考虑 使 用 链表 。 为 了 满足 功能 上 的 要 求 ,一 个 程序 中 也 可 以 启用 多 个 栈 。 
在 只 有 两 个 栈 的 情况 下 ,还 可 以 设法 利用 一 个 数组 的 共享 来 减少 "上 溢 ” 的 出 错 概率 。 

汇编 语言 相对 于 高 级 语言 的 差别 是 可 以 对 硬件 直接 操作 ,允许 用 户 建立 自己 的 堆栈 ,其 
存储 区 的 位 置 由 一 个 堆栈 段 寄存 器 SS 给 定 , 并 且 固 定 采用 SP 作为 指针 , 即 SP 的 内 容 为 栈 
顶 相 对 于 SS 的 偏 移 地 址 。 栈 空 时 ,SP 指向 堆栈 段 的 最 高 地 址 ,这 里 约定 为 栈 底 ,之 后 的 进 
栈 操作 导致 栈 顶 由 高 地 址 向 低地 址 变化 。 进 栈 指令 为 PUSH ,出 栈 指令 为 POP。 


习 题 


一 、 原理 讨论 题 

. 栈 和 线性 表 的 关系 是 什么 ? 

. 为 什么 迷宫 问题 需要 栈 ? 

. 为 什么 悔 棋 机 制 需要 栈 ? 

. 对 于 栈 的 两 种 存储 结构 ,数据 移动 性 问题 是 否 还 存在 ?为 什么 ? 
. 写 出 栈 的 主要 用 途 。 

、 理论 基本 题 

. 写 出 以 下 概念 的 定义 : 栈 、 栈 项 、 空 栈 。 

. 写 出 栈 的 性 质 。 

. 写 出 栈 的 主要 操作 清单 。 
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4. 对 于 数据 1.2、3、4, 给 出 使 用 栈 操作 后 可 能 产生 的 合法 结果 (三 种 ) 和 不 可 能 的 结果 
(两 种 ) 。 

5. 任意 3 个 数据 进 栈 后 , 画 出 链接 存储 结构 的 示意 图 。 按 是 否 带 有 头 结 点 分 为 两 种 方案 。 

6. 在 上 题 中 画 出 进 栈 和 出 栈 的 示意 图 。 

7. 任 给 一 个 十 进 制 整数 数据 , 画 出 通过 栈 进 行 数 制 转换 (结果 为 八进制 ) 的 示意 图 。 

三 、 编 程 基本 题 

1. 数据 逆序 的 产生 。 

2. 把 顺序 栈 的 源 代 码 改 为 非 模板 类 的 程序 ,处 理 的 数据 类 型 为 字符 型 。 

3. 把 链 栈 的 源 代 码 改 为 有 一 个 头 结 点 ,并且 处 理 的 数据 类 型 为 整数 型 ,在 头 结 点 的 数 
据 域 中 存储 结 点 个 数 。 

4. 把 链 栈 的 源 代 码 改 为 模板 类 的 程序 。 

四 、 编 程 提 高 题 

1. 双 栈 共享 空间 。 如 果 在 一 个 应 用 中 需要 启用 两 个 栈 , 双 栈 使 用 顺序 存储 的 形式 ,很 
可 能 会 出 现 一 个 栈 的 空间 已 经 使 用 完毕 ,而 另外 一 个 栈 的 空间 还 有 剩余 的 情况 ,如 何 提高 空 
间 利 用 率 呢 ? 可 以 把 两 个 栈 合 在 一 个 申请 的 空间 (如 数组 ) 中 ,也 可 以 把 两 个 栈 分别 建 在 两 
端 。 栈 底 可 以 定义 在 数组 的 两 端 ,两 个 栈 项 随 着 数据 的 压 入 都 往 中 间 移 动 ,直到 两 个 栈 顶 相 
连 , 才 出 现 真正 的 * 溢 出”。 这 样 就 充分 利用 了 两 个 栈 的 设计 总 空间 。 图 4-10 是 双 栈 共享 空 
间 的 范例 。 其 中 栈 满 的 条 件 是 topl 十 1= top2。 


A topl top2 B 
A 栈 = 


4-10 双 栈 共享 空间 示意 图 


2. 表达 式 求 值 处 理 。 首 先 表 达 式 是 由 运算 数 .运算 符 、 括 号 组 成 的 有 意义 的 式 子 。 运 
算 符 从 运算 数 的 个 数 上 分 ,有 单 目 运算 符 ( 只 需要 在 运算 符 右边 提供 一 个 运算 数 ,如 求 相反 
数 ) 和 双 目 运算 符 ( 必 须 在 运算 符 左 边 和 右边 各 提供 一 个 运算 数 , 如 加 \ 减 、 乘 ,除法 ); 从 运 
算 类 型 上 分 ,有 算术 运算 .关系 运算 、 逻 辑 运算 等 。 这 里 只 是 为 了 说 明 这 种 思路 的 原理 ,所 以 
讨论 只 含 二 目 运算 符 的 算术 表达 式 。 对 于 这 种 数学 中 最 常见 的 表达 式 书 写法 ,定义 一 个 名 
称 即 中 缀 表达 式 , 它 表示 每 个 二 目 运算 符 都 写 在 两 个 运算 量 的 中 间 , 如 : 3 十 2* 5 一 (10 十 
6 2 "8 

假设 所 讨论 的 算术 运算 符 包括 : 十 (加 法 )、 一 (减法 )、* (乘法 )、/( 除 法 )、% (整除 )、 
^( 乘 方 ) 和 括号 () ,按照 常规 运算 规则 ,可 以 看 到 运算 符 的 优先 级 为 : 首先 是 () ,然后 是 ^, 青 
次 是 * 、/、%, 最 后 是 十 ,一 ; 同 级 别 的 从 左 至 右 计 算 , 有 括号 出 现时 先 算 括 号 内 的 ,后 算 括 
号 外 的 ,多 层 括号 则 由 内 向 外 进行 ; 乘 方 连续 出 现时 则 先 算 最 右边 的 。 表 达 式 作为 一 个 满 
足 表达 式 语法 规则 的 串 存 储 , 这 里 约定 用 井 表 示 该 表达 式 串 已 经 结束 ,如 : 3 十 2* 5 一 (10 十 
6)/8 井 。 

数据 结构 : 启用 两 个 栈 , 一 个 是 运算 数 栈 , 另 外 一 个 是 运算 符 栈 。 

算法 处 理 规则 : 自 左 向 右 扫 描 表 达 式 中 每 一 个 字符 ,车 当前 字符 是 运算 数 , 则 进入 运算 
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数 栈 ; 如 果 是 运算 符 , 则 需要 进行 判别 后 分 别处 理 。 若 这 个 运算 符 比 当前 栈 顶 运算 符 的 级 
别 高 则 继续 进入 运算 符 栈 ,然后 继续 向 后 读 取 字 符 。 若 这 个 运算 符 比 栈 顶 运算 符 级 别 更 低 
或 相等 , 则 从 运算 数 栈 取出 两 个 运算 数 , 同 时 从 运算 符 栈 中 压 出 一 个 运算 符 开始 进行 运算 。 
出 栈 的 两 个 数据 应 该 分 别 作 为 右 运算 数 和 左 运算 数 。 之 后 将 运算 结果 送 入 运算 数 栈 , 继 续 
处 理 当前 字符 ,直到 遇 到 结束 符 , 然 后 计算 过 程 ,直到 栈 中 只 剩 下 一 个 数据 时 结束 ,此 时 计算 
结果 正好 在 运算 数 栈 的 当前 栈 项 。 

上 面 的 思路 基本 正确 ,尤其 是 对 于 没有 括号 的 情形 ,但 还 有 两 个 问题 没有 得 到 很 好 的 解 
决 。 第 一 是 多 级 括号 的 处 理 ,第 二 是 连续 的 乘 方 。 根 据 运 算 规 则 , 当 遇 到 左 括号 ”(? 在 栈 外 
时 它 的 级 别 显然 最 高 ,一 旦 进 栈 后 它 的 级 别 必 须 改 为 最 低 ; 而 乘 方 运算 的 结合 性 却 是 自 右 
向 左 ,所 以 , 它 的 栈 外 级 别 又 高 于 栈 内 的 , 即 运算 符 在 栈 内 和 栈 外 的 级 别 可 能 不 同 。 当 遇 到 
右 括号 ") ”时 ,一 直 需 要 对 运算 符 栈 出 栈 ,并 且 做 相应 计算 ,直到 遇 到 栈 顶 为 左 括号 ”(? 时 ,将 
其 出 栈 , 因 此 右 括号 ) ?级别 最 低 但 它 却 不 必 进 栈 , 故 定义 为 一 1。 

下 面 为 设计 时 约定 的 一 些 细节 。 运 算数 栈 初始 化 为 空 , 为 了 使 表达 式 中 的 第 一 个 运算 
符 能 够 进 栈 , 在 运算 符 栈 中 预 设 一 个 最 低级 的 运算 符 “(”"。 计 算 过 程 结束 时 ,此 运算 符 还 留 
在 运算 符 栈 中 。 根 据 以 上 讨论 ,每 个 运算 符 栈 内 、 栈 外 的 级 别 分 别 定义 如 表 4-2 所 示 。 为 了 
更 快 掌握 这 种 计算 表达 式 的 思路 , 表 4-3 给 出 了 3 个 例子 。 第 一 个 比较 简单 ,第 二 个 涉及 括 
号 ,第 三 个 涉及 多 级 括号 和 连续 方 宕 。 


表 4-2 运算 符 级 别 约定 表 


运 算 符 栈 内 级 别 栈 外 级 别 
3 4 
*\/\% 2 2 
十 ,一 1 
( 0 4 
)》 一 一 1 


表 4-3 表达 式 计算 过 程 范例 


读 字符 | 运算 数 栈 | 运算 符 栈 备 注 
@ 计算 3 十 2* 4 一 2# 的 过 程 
3 3 ( 运算 符 栈 中 首先 预 设 一 个 ( 
党 3 (《, 十 
2 3、2 《十 
x 3,2 Cy 
4 3、2、4 《、 十 、* 
(十 因为 一 的 级 别 比 * 低 , 故 计算 2 * 4, 结 果 再 次 进 运算 数 栈 。 
一 没有 进 栈 
3 ¢ 继续 处 理 一 。 一 的 级 别 和 十 同 级 ,计算 3 十 8, 结 果 进 运算 
数 栈 。 一 依然 没有 进 栈 
11 性 二 不 动 ,继续 处 理 。 因 为 一 已 经 比 ( 的 级 别 高 , 进 运算 符 栈 
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续 表 
读 字符 | 运算 数 栈 | 运算 符 栈 备 注 
2 #2 C= 
# 9 ( 计算 过 程 结束 , 结 果 为 栈 顶 的 9 
@ 计算 9 十 (3*4 一 2)/5# 的 过 程 
9 9 ( 
十 9 《、\ 士 
9 (G+, 
3 9 人 二 
x 9.3 (、 十 (= 
4 9、3、4 《〈、 十 、(、* 
一 9、12 Cs 遇 到 一 后 , 先 计 算 了 3 * 4, 结 果 进 栈 
9、12 Ka 不 动 ,继续 处 理 一 。 因 为 一 已 经 比 ( 的 级 别 高 , 进 运算 符 栈 
交 9、12、2 (、 十 、(、 一 
5 C+ 遇 到 ), 所 以 直接 计算 12 一 2,) 并 不 进 栈 。 计 算 完 后 , 把 
(出 栈 
/ 9.10 st 
5 9.10,5 LO 
## 9、2 《十 遇 到 # ,把 10/5 计算 出 来 
可 运算 数 栈 中 并 不 是 只 剩 一 个 数据 ,所 以 继续 计算 。 结 果 
为 11 
@ 计算 2^((4 十 5)/3)^2# 的 过 程 
2 2 ( 
A 2 《从 
( 2 《CS 这 
E 2 CoC 栈 内 (的 级 别 为 0, 外 面 的 (的 级 别 为 4, 故 继续 进 栈 
4 2.4 Cat 
十 2、4 CR 后 
5 2、4.5 《ssCsks 填 
) Ce 遇 到 ), 所 以 直接 计算 4 十 5,) 并 不 进 栈 。 计 算 完 后 , 把 
(出 栈 
/ 2.9 (CCV 
3 2.9.3 Ca 
) 2 (a* 遇 到 ), 所 以 直接 计算 9/3,) 并 不 进 栈 。 计 算 完 后 ,把 (出 栈 
人 2 ES 栈 内 “的 级 别 为 3, 外 面 的 ^ 的 级 别 为 4, 故 继续 进 栈 
名 2 Ce 
# 2.9 a 遇 到 结束 符 , 先 计算 3 ^2, 把 结果 9 压 入 栈 
512 x‘ 继续 计算 ,得 到 结果 512 
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用 上 述 思路 计算 中 绥 表 达 式 并 不 是 最 简捷 的 ,也 不 是 编译 系统 真正 使 用 的 思路 ,后面 章 
节 会 讨论 更 精妙 的 计算 过 程 。 

3. 行 编辑 软件 对 输入 字符 的 处 理 。 目 前 常用 的 字 处 理 软件 Word 和 WPS 都 已 经 做 到 
了 “所 见 即 所 得 ”, 光 标 可 以 上 、 下 、 左 、 布 移动 ,十 分 方便 。 最 初 的 文字 编辑 环境 是 行 编辑 ,也 
就 是 只 能 对 一 行内 的 文本 进行 编辑 。 那 么 在 进行 诸如 修改 字符 或 取消 本 行 时 该 编辑 软件 是 
如 何 处 理 的 呢 ? 

约定 本 行 编辑 程序 的 功能 为 从 键盘 接收 用 户 输入 的 字符 ,之 后 把 正确 的 文本 转 入 数据 
区 。 为 了 达到 这 个 目的 ,使 用 “接收 一 个 字符 马上 转 入 数据 区 ”的 思路 显然 是 错误 的 ,正确 的 
处 理 方式 是 启用 一 个 栈 ,约定 @ 为 退 格 ,功能 为 删除 刚 输 入 的 一 个 字符 。 约 定 一 为 清除 本 
行 。 相 应 的 处 理 规则 为 : 对 用 户 输 入 的 字符 进行 判断 ,如 果 不 是 退 格 符 , 也 不 是 清除 本 行 
符 , 则 进 栈 ; 如 果 是 退 格 符 , 则 出 栈 一 次 ; 如 果 是 清除 本 行 符 , 则 将 栈 进行 初始 化 。 本 行 输 
入 结束 时 ,把 这 个 栈 看 成 普通 的 线性 表 , 遍 历 将 全 部 数据 从 左 至 右 依 次 输入 数据 区 ,同时 将 
栈 初始 化 为 空 。 

在 本 范例 中 ,可 以 看 到 综合 应 用 两 种 数据 结构 的 思想 方法 ,这 是 很 重要 的 计算 机 编程 技 
巧 。 由 于 这 个 数据 结构 的 作用 比较 特殊 ,就 不 单独 称 它 为 栈 或 线性 表 了 ,结合 应 用 为 它 起 一 
个 名 字 , 称 为 “输入 缓冲 区 ”。 

表 4-4 为 行 编辑 软件 输入 字符 的 处 理 。 

表 4-4 行 编辑 软件 输入 字符 的 处 理 
输入 序列 输入 数据 区 的 内 容 


# im@nclude < iostream> 
# define max@ @ @MAXLEN 1024 
typedef struct stacknode 


# include < iostream> 
# define MAXLEN 1024 
typedef struct stacknode 


int data; ~ 
ee { ehar data 
; 
struct stacknoo@de * next; struct stacknode * next; 
}node }node 


4. 编程 进行 表达 式 括号 是 否 正确 匹配 的 判断 ,同时 有 3 种 括号 ,要 把 可 能 的 各 种 错误 
情况 都 能 正确 反映 出 来 。 

5. 回 文字 符 串 的 判别 。 如 果 一 个 字符 串 ,如 英文 单词 , 正 读 和 反 读 都 是 一 样 的 , 则 称 它 
为 回 文 。 如 : Anna、Bob .Dad、Mom Otto ,tot\pop ,civic level .madam。 回 文 还 可 以 造句 ， 
如 : Madam, Tm Adam. (夫人 ,我 是 亚当 。) 又 如 : Dennis sinned. 丹尼斯 犯罪 了 。 如 果 以 单 
词 为 单位 ,也 可 以 看 到 句子 的 回 文 , 如 : You can cage a swallow，can't you, but you can't 
swallow a cage， can you? ( 您 可 以 把 燕子 关 进 笼子 里 ,是 吧 ? 可 是 您 不 能 把 笼子 吞 下 肚 ,不 
是 吗 ?) 中 文 也 有 诸如 * 花 非 花 交 人 上 人 且 出 外 山区 苦 中 苦 ? 等 说 法 ,还 可 以 见 到 “上海 自 来 水 
来 自 海上 ”“ 西 东 当 铺 当 东西 ”等 对 联 ,大 诗人 苏东坡 还 写 出 了 一 首 回 文 诗 : 春晚 落花 余 奖 
草 , 夜 凉 低 月 半 梧 桐 。 人 随 雁 远 边 城 募 , 雨 映 足 帘 绣 阁 空 。 对 应 的 是 : 空间 绣 帘 玖 映 雨 , 暮 
城 边远 雁 随 人 。 梧 桐 半月 低 凉 夜 , 草 正 余 花 落 晚 春 。 以 下 回 文 诗 更 有 意思 ,不 但 全 首 可 自 尾 
倒 读 , 且 每 句 顺 读 倒 读 也 都 一 样 : 处 处 飞花 飞 处 处 , 泼 泼 碧水 正 泼 漏 ; 树 中 云 接 云 中 树 ， 


< 80 


第 4 章 栈 的 构造 与 应 用 


山 外 楼 遮 楼 外 山 。 编 写 一 个 程序 来 判断 一 个 字符 串 是 否 是 回 文 ,这 里 约定 字符 串 完全 相同 
指 的 是 每 个 对 应 位 置 的 字符 都 相同 。 

五 、 思 考题 

1. 象棋 对 弈 系统 悔 棋 机 制 。 设 计 一 个 象棋 对 弈 系统 ,希望 有 悔 棋 机 制 ,但 是 并 不 要 求 
无 限制 地 一 直 悔 棋 , 约 定 为 每 一 方 至 多 连续 悔 棋 3 次 ,加 在 一 起 就 是 6 个 刚刚 走 过 的 步 又 。 
这 里 很 自然 要 用 到 栈 ,问题 是 空间 申请 过 多 又 没有 用 ,只 申请 6 个 单元 ,又 容易 很 快 用 完 。 
既然 新 的 步骤 又 出 现 了 ,最 初 的 步骤 就 没有 用 了 。 那 可 不 可 以 把 数据 都 往 前 移动 呢 ? 这 是 
可 以 的 ,如 果 希 望 不 采用 数据 移动 ,如 何 完成 这 个 功能 ? 写 出 可 以 执行 的 程序 。 

2. 迷宫 问题 的 模拟 系统 。 公 园 中 ,有 人 使 用 竹子 拱 起 了 一 个 迷 魂 阵 , 也 就 是 迷宫 。 它 
的 特点 是 人 进去 后 ,能 看 到 所 有 的 竹子 和 路 ,但 是 走 来 走 去 却 发 现 很 多 是 死路 或 者 环 路 。 人 
们 可 以 反复 试 走 和 观察 ,要 走出 来 还 是 有 一 定 难 度 的 。 如 何 用 计算 机 程序 来 模拟 一 只 老鼠 
找 迷宫 出 口 的 问题 呢 ? 
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本 童 主要 介绍 第 三 种 数据 结构 一 一 队列 。 它 是 一 种 特殊 的 线性 结构 ,本章 介绍 它 的 逻 
辑 结构 ,存储 结构 ,对 其 存储 结构 介绍 顺序 队 、 链 队 和 环 状 队列 3 种 实现 形式 。 队 列 用 来 帮 
助 解决 计算 机 程序 设计 中 遇 到 的 许多 难题 。 本 书后 面 的 许多 数据 结构 相关 程序 设计 也 需要 
队列 结构 来 支持 。 


5.1 引 


了 中 


先 通过 现实 生活 中 的 一 些 现 象 来 了 解 队列 的 工作 原理 ,如 在 银行 ,火车 站 、 食 堂 排队 等 
待 服务 或 购 票 等 ; 重型 机 关 枪 的 子弹 夹 是 从 侧面 横 排 插入 的 ,最 先进 去 的 子弹 也 就 最 先 被 
击发 出 去 ; 再 如 汽车 制造 三 的 总 装配 线 上 ,所 有 车 辆 的 底盘 逐个 进入 ,之 后 开始 装配 ,车 辆 
离开 车 间 也 是 先进 去 的 先 出 去 。 这 种 特性 被 称 为 先进 先 出 ”, 通 俗 地 讲 就 是 排队 。 

本 章 通过 对 线性 表 的 改造 来 完成 对 数据 "先进 先 出 ?特性 的 处 理 , 主 要 是 对 线性 表 的 搬 
和 人 和 删除 操作 增加 约束 条 件 。 约 束 条 件 为 只 能 在 线性 表 的 某 一 端 进行 删除 ,必须 在 另外 一 
端 进行 插入 (一 旦 决定 后 ,插入 和 删除 端 不 能 再 互 换 ) ,中 间 的 任何 位 置 也 不 能 进行 持 删 ,这 
就 构成 了 “队列 ”, 它 就 具有 "先进 先 出 ”的 性 质 。 


5.2 ”队列 的 逻辑 结构 


队列 (queue) 是 限制 只 在 表 的 一 端 进行 插入 .在 表 的 另 一 端 进行 删除 的 线性 表 。 人 允许 插 
入 的 一 端 叫 队 尾 Crear) ,允许 删除 的 一 端 叫 队 头 (front)。 搬 入 
数据 操作 称 为 入 队 ,删除 数据 操作 称 为 出 队 ; 当 表 中 没有 元 素 


k 时 称 为 
[ 队列 的 工作 原理 来 自 现实 生活 中 基于 时 间 的 公平 性 原则 
( 先 到 先 服务 ) ,排队 是 通常 的 管理 思想 方法 ,如 图 5-1 所 示 。 
图 5-1 先进 先 出 原 栈 类 似 : 队 列 也 是 程序 设计 中 最 常用 的 数据 结构 “先进 先 
理 示意 图 在 英语 中 为 First In First Out, 故 队列 也 称 为 FIFO et 
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性 在 很 多 需要 按照 时 间 公 平 的 原则 处 理 的 程序 设计 中 非常 有 用 。 

队列 的 实现 也 可 以 通过 顺序 存储 或 链接 结构 来 完成 。 如 果 是 顺序 存储 ,开始 就 要 确定 队 
列 的 大 小 ,队列 的 “上 溢 ” 问 题 比较 复杂 ,后 面 会 专门 讨论 。 相 比 之 下 ,使 用 链接 结构 则 不 需要 
先行 设计 空间 大 小 ,只 要 在 申请 空间 时 操作 系统 能 返回 可 以 使 用 的 地 址 ,就 没有 “上 溢 ” 的 问题 。 

在 具体 实现 顺序 队 的 过 程 中 ,要 注意 队 头 和 队 尾 并 不 是 一 个 固定 的 地 址 ,如 数组 的 某 个 
边界 。 队 头 和 队 尾 的 位 置 都 随 进出 队 的 操作 变化 。 一 般 约 定 用 变量 rear 指向 队 尾 ,用 front 
指向 队 头 。 

显示 队 中 所 有 数据 应 该 理解 为 线性 表 的 基本 操作 , 故 不 列 在 下 面 的 操作 清单 中 。 

队列 的 主要 操作 见 表 5-1。 

表 5-1 队列 的 基本 操作 


操作 名 称 建议 算法 名 称 编程 细节 约定 
编程 时 通过 构造 函数 完成 。size 是 空间 的 大 小 ,不 需 
队列 初始 化 create(size) 要 时 则 没有 该 参数 
销毁 队列 destroy(queue) 释放 队列 所 占 的 空间 
判 队列 空 isempty(queue) 若 queue 为 空 队 返 回 1 ,否则 返回 0 
判 队列 满 isfull(queue) 若 queue 为 满 队 返回 1, 否 则 返回 0 
入 队 oR RO 在 队列 queue 的 尾 部 追 加 一 个 新 元 素 newdata， 
newdata 成 为 新 的 队 尾 元 素 
出 队 a 本 queue 的 头 部 元 素 从 队列 中 删除 ,队列 少 了 一 个 
元 素 
读 队 头 元 素 getfront(queue) 把 队 头 元 素 作为 结果 返回 , 队 头 指针 不 变化 


例 5-1 约定 人 队 操作 用 in 表示 ,出 队 操作 用 out 表示 ,对 于 数据 (1,2,3) ,约定 从 左 到 
右 的 次 序 用 队列 依次 处 理 一 次 , 即 进 队 一 次 ,出 队 一 次 。 如 果 操 作 序列 是 合法 的 , 即 排除 了 
入 队 操 作 少 而 出 队 操作 多 的 出 错 情 况 ,结果 只 有 一 个 , 那 就 是 原来 的 次 序 , 不 论 是 in in\in、 
out、out、out, 还 是 in、out、in、out、in、out, 或 者 是 其 他 的 操作 序列 ,其 结果 都 是 (1,2,3)。 这 
个 例子 说 明了 队列 的 工作 性 质 “ 先 进 先 出 ”。 


5.3 ”队列 的 顺序 存储 


下 面 介绍 队列 的 顺序 存储 ,采用 顺序 存储 来 实现 队列 ,就 是 顺序 队 。 顺 序 队 中 的 数据 元 
素 依 次 放 在 一 片 连续 的 空间 中 ,为 了 便于 算法 设计 ,启用 一 维 数组 来 实现 , 队 头 指针 (front) 
和 队 尾 指针 (rear) 的 初始 值 都 是 0。 约定 front 记录 当前 的 实际 队 头 ,始终 指向 可 以 出 队 的 
数据 。 注 意 用 rear 变量 记录 实际 可 用 的 位 置 , 而 不 是 实际 队 尾 。 这 样 就 可 以 简单 地 判断 出 
是 否 是 空 队 。 

图 5-2 为 队列 的 顺序 存储 示意 图 .queuedata 为 数组 名 。 其 中 先 连 续 进行 人 队 6 次 , 数 
据 为 (20,19,63.01,17,87) ,然后 再 出 队 3 次 .再 人 队 两 次 ,数据 为 (05,07)。 随 着 数据 的 入 
队 和 出 队 ,rear 和 front 指针 都 逐渐 移 向 示意 图 的 右边 。 
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front rear 


queuedata 苛 19 


四 加 加 加 | | | 
O23 6 789 
front rear 
Uy 
queuedata 17| 87| 05 | 07 


0123456789 
图 5-2 队列 的 顺序 存储 示意 图 


因为 rear 始终 指向 可 用 空间 ,一旦 移 到 下 标 10 处 ,显然 已 经 越界 。 再 要 求人 队 则 “上 
溢 ”, 通 过 图 5-3 可 以 看 到 队列 空间 并 没有 用 完 , 故 这 种 溢出 称 为 “ 假 溢出 ”。 


front Tear 
queuedata 到 林 17 |87 |05 |07 112 |31 
四 


5-3 ”队列 的 顺序 存储 “ 假 溢出 ”示意 图 


在 图 5-2 中 ,继续 入 队 两 次 ,数据 为 (12,31) 后 还 要 入 队 , 则 * 假 溢出 ”出 现 。 

要 解决 “ 假 溢出 ”问题 ,必须 设法 利用 全 部 空间 。 

第 一 种 方案 : 事后 处 理 。 当 出 现 * 假 溢出 ?时 ,把 所 有 数据 全 部 向 前 移动 ( 即 左边 ), 使 当 
前 队 头 数据 移 到 数组 的 0 下 标 处 ,所 有 可 用 空间 出 现在 数组 的 后 面 ( 即 右边 ) , 它 的 特点 是 平 
时 不 考虑 数据 的 移动 ,出 现 * 假 溢出 ”后 再 处 理 。 但 每 次 移动 的 数据 总 量 和 移动 的 偏 移 量 ( 即 
向 左 移动 几 个 位 置 ) 都 要 计算 。 

第 二 种 方案 : 事前 防范 。 在 每 次 出 队 时 ,都 将 队列 中 所 有 元 素 向 前 移 一 个 位 置 。 这 样 
一 且 出 现 “ 上 溢 ? 就 肯定 是 真正 的 "上 溢 ”。 它 的 特点 是 每 个 数据 每 次 只 前 移 一 个 位 置 , 相 比 
第 一 种 方案 ,数据 移动 量 更 多 。 

不 论 使 用 以 上 哪 种 方案 ,都 会 引起 大 量 元 素 的 移动 ,因此 这 种 操作 会 导致 时 间 效 率 降 
低 , 所 以 下 面 将 介绍 不 需要 移动 数据 而 解决 “ 假 溢出 ”的 环 状 队列 。 


5.4 队列 的 环 状 顺序 存储 


为 了 解决 “ 假 溢出 ”, 计 算 机 科学 家 大 胆 地 设想 把 顺序 结构 的 头 尾 相连 , 造 出 了 一 个 所 谓 
的 “ 环 状 队列 ”。 

图 5-4 是 环 状 队列 的 操作 示意 图 ,展示 了 从 空 队 开始 逐步 演变 到 满 队 的 情况 。 其 中 , 虚 
线 箭头 表示 两 个 前 移 的 方向 。 

在 环 状 队列 中 初始 状态 为 front 二 rear 二 0, 此 时 队 空 。 每 次 入 队 时 ,应 该 先 把 数据 存 入 
当前 rear 的 位 置 上 ,之 后 用 rear 二 rear 十 1 向 前 移动 尾 指 针 。 出 队 时 用 front=front 十 1 前 
移 即 可 。 环 状 的 实现 既 可 以 用 让 语句 也 可 以 用 数学 中 的 求 模 函 数 ,因为 求 模 就 是 求 余数 ， 
不 论 什么 整数 address, 进 行 address mod 10 时 ,结果 就 在 0 到 9。 入 队 的 地 址 计算 为 rear 一 
(rear 十 1)%maxsize, 而 出 队 的 地 址 计算 为 front== (front 十 1) %maxsize。 


< 84 


第 5 章 ”队列 的 构造 与 应 用 


(e) 再 入 队 3 次 ,出 队 3 次 (d) 再 入 队 4 次 
5-4 环 状 队列 的 操作 示意 图 


由 于 rear 始终 指向 可 用 空间 ,在 全 部 空间 用 完 时 ,正好 是 front 二 二 rear, 那 么 如 何 区 分 
队 空 和 队 满 呢 ? 方法 一 : 启用 一 个 计数 器 记录 当前 队 中 的 数据 个 数 。 方 法 二 : 牺牲 一 个 空 
间 , 当 rear 十 1 二 front 时 认为 队 满 ,图 5-4(d) 就 符合 这 个 条 件 。 下 面 程序 中 使 用 的 是 第 一 种 
方案 。 

【程序 源码 5-1】 环 队 实现 队列 基本 功能 。 

// 功 能 : 环 队 实现 队列 的 基本 功能 

# include < iostream.h> 

# include < conio.h> 

# include < windows.h> 

# include < iomanip.h> 

#include < math.h> 


#define Maxsize 10 // 设 置 环 队 的 最 大 空间 
enum returninfo{ success, fail, overflow, underflow, range_error}; // 定 义 返 回信 息 清单 
class loopqueue // 环 队 的 对 象 设计 
{ 
private: 

int data[ Maxsize]; // 静 态 数 组 实现 队列 

int front, rear; // 队 头 、 队 尾 指 针 
protected: 

int count; // 计 数 器 。 统 计 结 点 个 数 , 即 线 

// 性 队列 的 长 度 

public: 

loopqueue( ); // 构 造 函 数 
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一 loopqueue() ; // 析 构 函 数 
void clearqueue(void); // 清 空 环 队 
bool empty(void) const; // 判 断 是 否 空 队 
int size(void) const; // 求 环 队 的 长 度 
returninfo traverse(void); // 遍 历 环 队 所 有 元 素 
returninfo getfront(int &item) const; // 读 取 队 头 
returninfo insert(const int &item); // 数 据 入 队 
returninfo remove( int &item); // 数 据 出 队 
js 
returninfo loopqueue: :traverse(void) // 遍 历 环 队 中 的 所 有 元 素 
{ 
if(empty()) 
return underflow; // 空 队列 的 处 理 
cout <<" 环 队 中 的 全 部 数据 为 : Front 一 >("; // 提 示 显 示 数 据 开 始 
for(int i= front;i< count + front;i++) // 循 环 显示 所 有 数据 
{ 
cout <<" "<< setw(2)<< data[ i % Maxsize]; 
if (i== count + front 一 1) 
cout <<" )<— Rear"<< endl; // 数 据 完毕 
else 
Cout <<" "5 // 数 据 中 间 
} 
return success; // 本 次 操作 成 功 
: 
returninfo loopqueue: :insert(const int &item) // 进 队 
{ 
if(count >= Maxsize) // 满 队 处 理 
return overflow; 
data[ rear] = item; // 给 数据 赋值 
rear = (rear + 1) % Maxsize; // 产 生 环 形 的 下 一 个 地 址 
Count++; // 计 数 器 加 1 
return success; 
} 
returninfo loopqueue: :remove( int &item) // 出 队 
{ 
if(empty()) // 空 队 处 理 
return underflow; 
item = data[ front]; // 保 存 数据 
front = (front + 1) % Maxsize; // 产 生 环形 的 下 一 个 地 址 
Count ——} // 计 数 器 减 1 


} 


return success; 


图 5-5 为 环 状 队列 程序 运行 界面 。 
时 间 效 率 评价 : 环 队 的 特点 是 ,不 用 移动 数据 就 处 理 了 “ 假 溢 出 ”的 问题 。 在 上 面 所 有 
函数 中 ,只 有 遍历 环 队 中 所 有 元 素 的 操作 是 O(n) 的 时 间 复 杂 度 ,其 他 的 都 是 O(1) 级 的 。 
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5-5 环 状 队列 程序 运行 界面 截图 


5.5 队列 的 链接 存储 


本 节 讨 论 使 用 链表 结构 来 实现 队列 ,也 称 为 链 队 。 因 为 分 别 在 两 端 进行 插入 和 删除 操 
作 , 故 用 单 链表 即 可 。 队 列 的 链接 存储 示意 图 如 图 5-6 所 示 。 如 果 把 front 设计 在 链表 的 尾 
部 ,rear 设计 成 链表 的 头 部 ,入 队 容 易 做 到 ,但 是 出 队 就 很 困难 ,除非 启用 双向 队列 ,但 是 付 
出 空间 的 代价 太 大 ,所 以 单 链表 的 头 指 针 处 设计 为 队 头 。 由 于 队列 使 用 链表 实现 时 ,插入 和 
删除 操作 都 在 边界 上 ,相对 比较 简单 ,就 不 提供 示意 图 了 。 


front 111 222 333 1 人 
Tear 


图 5-6 ”队列 的 链接 存储 示意 图 
【程序 源码 5-2】 链 队 实现 队列 基本 功能 。 


// 功 能 : 链 队 实现 队列 的 基本 功能 
// 本 程序 中 设置 了 头 结 点 

# include < iostream.h> 

# include < conio.h> 

# include < windows.h> 


enum returninfo{ success, fail, underflow, range_error}; // 定 义 错误 类 型 清单 
class node 
{ 
public 
int data; // 数 据 域 
node * next; // 结 点 指针 
}; 
// 链 队 对 象 设计 
class linkqueue 
. 
private: 
node * rear; // 尾 指针 
node * front; // 头 指针 
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protected: 
int count; 


public: 
linkqueue( ); 
~linkqueue( ); 
void clearqueue(void); 
bool empty(void) const; 
int size(void) const; 
returninfo traverse(void); 
returninfo getfront(int &item) const; 
returninfo insert(const int &item); 
returninfo remove( int &item); 
}; 
returninfo linkqueue: :traverse(void) 
{ 
node * searchp; 
if(empty()) 
return underflow; 
searchp = front 一 > next; 


cout <<" 链 队 中 的 全 部 数据 为 : Front 一 >[ 头 结 点 | - ] ->"; 


while( searchp!= rear 一 > next) 
{ 
cout <<"[ "<< searchp— > data; 
if (searchp == rear) 
cout <<" |^]<— Rear"<< endl; 
else 
cout <<" | - ] ->"; 
searchp = searchp — > next; 
} 


return success; 


} 


returninfo linkqueue: :insert(const int &item) 


{ 
node * newnodep = new node; 
newnodep -> data = item; 
rear 一 > next = newnodep; 
rear = rear 一 > next; 
Count++; 
return success; 
. 
returninfo linkqueue: :remove( int &item) 
{ 
if(empty()) 
return underflow; 
node * tempp = front 一 > next; 
item = tempp 一 > data; 
front 一 > next = tempp 一 > next; 
delete tempp; 
Count ——; 
return success; 


// 计 数 器 ,统计 结 点 个 数 , 即 
// 队 列 长 度 


// 构 造 函 数 

// 析 构 函 数 

// 清 空 链 队 

// 判 断 是 否 空 队 
// 求 链 队 的 长 度 
// 遍 历 链 队 所 有 元 素 
// 读 取 队 头 

// 数 据 人 队 
// 数 据 出 队 


// 遍 历 链 队 中 的 所 有 元 素 
// 启 用 搜索 指针 
// 空 队列 的 处 理 


// 提 示 显 示 数 据 开始 
// 循 环 显示 所 有 数据 


// 本 次 操作 成 功 
// 进 队 


// 给 数据 赋值 

// 这 一 步 可 以 看 出 有 头 结 点 
// 改 动 队 尾 指针 的 位 置 

// 计 数 器 加 1 


// 出 队 


// 改 变 指针 
// 释 放 该 结 点 
// 计 数 器 减 1 
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图 5-7 为 链 队 基 本 功能 程序 运行 界面 。 


本 链 队 实现 队列 的 基本 功能 (= 
队 基 本 功能 采 单 区 
er 国 | 
愉 
(遍历 全 部 数据 ) 
| 所 头 结 点 
: Front 一 >[ 头 结 点 !-]->5 111 1;-]->[ 222 1-]->[ 333 !^1< 一 Rear 
i 


5-7 链 队 基本 功能 程序 运行 界面 


时 间 效 率 评价 : 链 队 的 特点 是 在 链表 的 边界 进行 进 队 和 出 队 操作 ,在 上 面 所 有 函数 中 ， 
只 有 遍历 链 队 和 清空 链 队 中 所 有 元 素 的 操作 是 O(n) 的 时 间 复 杂 度 ,其 他 的 都 是 O(1) 级 的 。 


5.6 队列 的 应 用 案例 


队列 作为 数据 结构 ,主要 用 途 一 是 基于 时 间 公平 机 制 所 涉及 的 程序 设计 ,二 是 硬件 需要 
缓冲 区 处 理 的 实现 方案 。 

【应 用 案例 5-1】 打印 机 共享 问题 。 在 计算 机 未 联网 时 打印 机 无 法 共享 ,联网 后 发 现 
要 使 打印 机 共享 ,其 实 并 不 容易 。 例 如 打印 机 已 经 接 入 一 个 网 络 , 它 可 以 接收 网 络 中 任何 一 
台 计 算 机 上 用 户 的 打印 请 求 。 如 果 是 随时 接受 ,那么 正在 打印 A 用 户 的 文件 又 收 到 B 用 户 
的 打印 请 求 ,结果 是 多 个 用 户 的 文件 被 混 打 在 一 起 。 这 种 算法 思路 显然 错误 。 如 果 打 印 机 
空闲 就 接受 打印 请 求 否则 就 拒绝 ,那么 这 个 思路 好 像 解 决 了 第 一 种 情况 ,但 却 是 有 缺陷 的 。 
例如 正在 打印 A 用 户 的 文件 ,此 时 系统 拒绝 了 也 用 户 的 打印 请 求 , 于 是 B 用 户 先 去 做 其 他 
事情 ,此 时 A 用 户 的 打印 任务 可 能 已 经 完成 ,恰巧 C 用 户 的 打印 请 求 提 出 ,于 是 打印 机 又 开 
始 为 C 服务 。 此 时 B 又 来 申请 ,但 是 再 次 被 拒绝 。 这 种 按照 打印 机 是 否 空闲 接受 打印 请 求 
的 随机 管理 法 违反 了 时 间 公平 原则 ,用 程序 设计 技巧 无 法 解决 这 个 问题 。 

最 后 的 结论 是 启用 队列 进行 管理 。 算 法 是 如 果 有 打印 请 求 ,不 向 打印 机 提出 ,而 是 先 
“ 进 队 ”, 而 打印 机 空闲 时 则 执行 “出 队 ” 操 作 , 开 始 打印 一 个 新 的 任务 。 在 这 种 机 制 下 ,如 果 
B 用 户 的 文件 第 二 个 提出 申请 ,那么 必然 是 第 二 个 被 执行 打印 的 ,这 个 问题 圆满 解决 。 在 
Windows 操作 系统 下 的 多 任务 处 理 打印 事务 也 是 这 样 处 理 的 。 不 过 为 了 方便 用 户 , 没 有 开 
始 打印 的 任务 在 队列 中 间 也 可 以 删除 掉 , 体 现 了 数据 结构 在 编程 中 的 灵活 运用 。 

【应 用 案例 5-2】 主机 与 外 部 设备 之 间 速 度 不 匹配 问题 。 以 主机 和 打印 机 为 例 来 说 
明 , 主 机 输出 数据 交付 给 打印 机 打印 ,主机 输出 数据 的 速度 比 打印 机 打印 的 速度 要 快 得 多 ， 
若 直 接 把 输出 的 数据 送 给 打印 机 打印 ,由 于 速度 不 匹配 ,显然 是 不 行 的 。 解 决 方法 是 设置 一 
个 打印 数据 缓冲 区 ,主机 把 要 打印 输出 的 数据 不 断 写 人 这 个 缓冲 区 中 , 写 满 后 就 暂停 输出 ， 
继而 去 做 其 他 事情 ,打印 机 就 从 缓冲 区 中 按照 “先进 先 出 ?的 原则 依次 取出 数据 并 进行 打印 ， 
打印 完 后 再 向 主机 发 出 请 求 ,主机 接 到 请 求 后 再 向 缓冲 区 写 入 打印 数据 ,这 个 打印 数据 缓冲 
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区 就 是 队列 ,利用 队列 既 保证 了 打印 数据 的 正确 ,又 使 主机 提高 了 工作 效率 。 

【应 用 案例 5-3】 键盘 输入 速度 和 系统 处 理 速度 不 匹配 问题 。 当 通过 键盘 高 速 录入 
时 , 击 键 的 速度 较 快 ,但 是 系统 要 处 理 这 些 击 键 有 时 需要 更 多 的 时 间 , 如 汉字 的 处 理 需要 计 
算 相 关 的 字模 地 址 和 取出 显示 。 如 果 直 接 接收 ,因为 系统 处 理 的 速度 较 慢 ,势必 遗漏 一 些 字 
符 , 那 么 高 速 录 入 也 就 失去 了 可 能 ,因为 必须 慢 慢 击 键 ,等 待 每 一 个 字符 出 现在 屏幕 上 。 现 
在 的 键盘 已 经 解决 了 这 个 问题 ,可 以 放心 地 高 速 录 入 , 稍 后 会 发 现 那些 字符 会 逐渐 地 显示 出 
来 ,并 没有 丢失 。 这 就 是 键盘 输入 缓冲 区 的 功能 。 


5.7 本 章 总 结 


本 章 主要 介绍 了 队列 的 逻辑 结构 ,存储 结构 和 基本 操作 的 程序 设计 。 通 过 图 示 和 讨论 ， 
展示 了 队列 的 工作 原理 ,给 出 了 多 个 应 用 案例 。 许 多 问题 需要 按照 时 间 来 排队 处 理 , 通 过 算 
法 技巧 不 容易 解决 ,但 是 启用 了 队列 后 迎刃而解 。 

本 章 存储 结构 的 讨论 中 给 出 了 很 有 特色 的 环 状 队列 ,没有 引起 数据 移动 却 可 以 避免 “ 假 
溢出 ?现象 ,值得 好 好 思考 和 模仿 。 为 了 满足 功能 上 的 目的 ,一 个 程序 中 也 可 以 启用 多 个 
队列 。 


习 题 


一 、 原 理 讨 论题 

1. 循环 队列 解决 了 什么 问题 ?优点 是 什么 ”如 何 巧 妙 地 实现 环 状 ? 

2. 讨论 对 于 数据 1.2、3 ,给 出 使 用 队列 操作 后 可 能 产生 的 合法 结果 ,并 讨论 其 原因 。 

3. 讨论 队列 的 主要 用 途 。 

4. 队列 采用 顺序 存储 和 链表 存储 等 两 种 存储 结构 ,数据 移动 性 问题 是 否 还 存在 ? 为 什 
? 如 何 解 决 ? 

二 、 理论 基本 题 

1. 写 出 以 下 概念 的 定义 : 队列 、 队 头 、 队 尾 。 

2. 写 出 队列 的 性 质 。 

3. 写 出 主要 的 队列 栈 的 操作 清单 。 

4. 任意 3 个 数据 进 队 后 , 画 出 链接 存储 结构 的 示意 图 。 注 意 有 两 种 方案 (是 否 带 有 头 


了 从 


5. 根据 第 4 题 中 画 出 进 队 和 出 队 的 示意 图 。 

6. 画 出 环 队 操作 的 示意 图 。 

三 、 编 程 基本 题 

1. 编程 实现 顺序 队 的 进 队 和 出 队 ,用 数据 移动 法 解决 假 溢出 问题 。 

2. 编程 实现 环 队 的 所 有 功能 和 界面 设计 。 

. 把 链 队 的 源 代码 改 为 模板 类 的 程序 。 

四 、 编 程 提高 题 

1. 通过 栈 和 队列 的 联合 使 用 ,对 数据 进行 其 他 进 制 和 十 进 制 之 间 的 转换 , 主要 是 整数 
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部 分 需要 栈 , 小 数 部 分 需要 队列 。 

2. 编程 模拟 银行 窗口 的 接待 工作 。 

3. 编程 模拟 飞机 场 的 管理 工作 。 

五 、 思 考题 

1. 医院 挂号 排队 管理 系统 ,设计 一 个 医院 挂号 排队 管理 系统 ,要 求 做 到 先 来 先 挂号 。 
因为 要 实现 按照 时 间 公 平 特性 的 机 制 ,自然 就 应 启用 队列 。 问 题 是 在 医院 挂号 过 程 中 ,如 果 
完全 按照 时 间 公 平 的 原则 ,也 不 尽 合理 ,如 突 发 事件 的 重病 人 ,排队 等 待 挂 号 也 不 可 行 。 要 
求 一 方面 要 按照 时 间 公平 性 处 理 一 般 病人 ,同时 能 够 处 理 紧 急 情况 , 编 出 可 以 执行 的 程序 。 

2. 假设 正在 设计 一 个 大 型 计算 机 CPU 共享 的 模拟 系统 ,对 象 为 正在 进行 科研 工作 的 
老师 .毕业 设计 的 学 生 , 还 有 刚 入 门 学 习 高 级 语言 的 学 生 做 一 些 上 机 的 练习 。 如 果 按 照 同等 
时 间 片 分 配给 所 有 人 ,显然 不 合理 。 因 为 不 同 的 对 象 的 上 机 任务 的 重要 度 并 不 一 致 。 如 何 
兼顾 时 间 公 平和 任务 的 重要 度 呢 ? 挑战 课题 就 是 在 这 套 系统 中 一 方面 按照 时 间 公平 性 处 理 
所 有 用 户 ,同时 能 够 兼顾 不 同 的 任务 重要 度 。 编 出 可 以 执行 的 程序 。 

3. 有 些 问 题 , 如 持续 运行 的 实时 监控 系统 源源 不 断 地 接收 到 监控 对 象 顺序 发 来 的 信息 
(如 报警 或 现场 记录 ) ,为 了 保持 信息 的 时 间 顺 序 性 ,就 要 按 顺 序 保存 ,而 这 些 信息 无 穷 无 尽 ， 
不 可 能 将 它们 全 部 驻 留 在 内 存 中 ,如 何 很 好 地 处 理 这 个 问题 ? (提示 : 要 约定 一 个 时 间 期 
限 ,超过 此 期 限 的 信息 就 无 用 ) 
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本 章 主 要 介绍 第 四 种 线性 数据 结构 一 一 串 , 以 及 它 的 逻辑 结构 .多 种 存储 结构 的 实现 ， 
特别 是 推出 了 索引 存储 结构 ,给 出 一 批 相关 的 程序 设计 ,最 后 给 出 多 个 应 用 范例 。 串 是 一 种 
特殊 的 线性 表 , 也 可 以 理解 为 线性 表 的 应 用 ,在 文本 和 其 他 信息 处 理 中 都 有 很 多 的 实用 性 。 


6.1 引 


了 咱 


“ 串 ? 就 是 通常 所 说 的 “字符 串 ”。 串 最 常见 的 应 用 就 是 文字 处 理 , 当 要 利用 计算 机 处 理 
一 个 报告 .计划 、 小 说 等 各 类 文章 时 ,实际 上 就 是 处 理 字符 串 。 专 设 一 童 来 讨论 它 , 是 因为 
“ 串 ” 作 为 一 种 非常 特殊 的 结构 在 编程 时 非常 有 用 ,已 经 发 展 成 为 一 个 专门 领域 。 

在 计算 机 程序 设计 中 ,程序 也 是 字符 串 , 当 需要 对 程序 进行 任何 修改 、 添 加 、 删 除 时 就 是 
在 做 字符 串 处 理 。 进 一 步 , 当 编译 系统 处 理 源 程序 的 时 候 也 是 在 做 一 种 特殊 的 字符 串 处 理 ， 
最 后 变 成 了 可 执行 文件 ,其 结果 实际 上 还 是 一 种 新 的 字符 串 。 

在 日 常 的 数据 处 理 中 ,信息 不 可 能 全 部 是 数值 ,通常 还 会 有 名 称 、 出 生地 、 电 话 、 联 系 方 
法 等 字符 组 成 的 信息 ,对 于 这 些 信息 在 计算 机 中 如 何 才 能 正确 存储 和 高 速 读 取 ,也 是 很 重要 
的 研究 课题 。 

不 同 的 国家 有 不 同 的 文字 ,对 中 国 用 户 来 说 还 有 汉字 处 理 的 问题 , 它 的 数量 极 多 ,不 能 
用 简单 的 横竖 撤 捧 来 形成 ,如 何 做 到 汉字 库 的 存储 、 汉 字 的 提取 、 显 示 、 编 辑 和 打印 等 都 是 字 
符 串 的 应 用 。 

高 级 语言 中 通常 直接 提供 数据 类 型 字符 串 , 但 是 C 语言 一 般 使 用 字符 数组 来 处 理 字符 
串 。 能 够 处 理 字 符 串 的 函数 是 很 多 的 。 


6.2 串 的 逻辑 结构 


串 ( 即 字符 串 ) 是 由 零 个 或 多 个 任意 字符 组 成 的 字符 序列 。 一 般 记 作 : 


string = "sl sz… So" 


式 中 string 是 串 名 。 本 章 用 双 引 号 作为 串 的 定 界 符 . 引 号 引起 来 的 字符 序列 就 是 串 值 ， 
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引号 本 身 并 不 属于 串 的 内 容 。 对 于 一 个 任意 字符 ai (1 二 i<n), 称 为 串 的 元 素 ,是 构成 串 的 
基本 单位 ,i 是 它 在 整个 串 中 的 序号 ,从 1 开始 统计 。 串 是 一 种 特殊 的 线性 表 , 特 殊 之 处 在 于 这 
种 线性 表 的 数据 元 素 仅 由 一 个 “字符 ?组 成 ,计算 机 非 数 值 处 理 的 对 象 经 常 都 是 字符 串 数据 。 

串 的 长 度 简称 串 长 ,表示 串 中 所 包含 的 字符 个 数 。 

此 处 的 串 长 定义 是 基于 ASCII 码 字 符 的 。 在 计算 机 诞生 之 初 ,从 键盘 输入 到 实际 存储 
只 考虑 了 英文 大 小 写字 母 ,数字 、 标 点 符号 、 运 算 符 、 光 标 控制 键 和 其 他 功能 控制 键 等 ,这 样 
就 有 一 个 对 应 的 ASCII 码 表 ,而 中 文 文字 信息 处 理 是 在 后 期 不 断 改 进 中 才 加 入 的 。 由 于 汉 
字 的 字 型 信息 量 过 多 ,所 以 ASCII 码 表 没有 足够 的 空间 存储 汉字 编码 ,一 个 ASCII 码 的 长 
度 空间 又 不 足以 存储 一 个 汉字 的 信息 量 , 解 决 方案 就 是 使 用 两 个 ASCII 码 字符 的 长 度 来 存 
储 一 个 汉字 信息 , 称 为 “全角” 或 “ 倍 宽 ”, 在 屏幕 上 可 以 看 到 一 个 汉字 的 宽度 也 是 两 个 ASCII 
码 字 符 的 宽度 。 为 了 在 文字 处 理 中 做 到 对 齐 、 美 观 ,还 产生 了 “全 角 ” 字 符 , 即 所 有 正常 的 
ASCII 码 字 符 都 有 另外 一 个 形式 ,它们 也 同样 占用 两 个 ASCII 码 字符 占用 的 空间 ,这 些 全 角 字 
符 都 是 图 形 符号 ,并 不 是 ASCII 码 字符 ,所 以 在 编程 语句 中 是 不 能 使 用 这 些 字符 的 ,在 DOS 等 
命令 环境 下 也 不 能 使 用 ,和 否则 会 提示 语法 错误 。 另 外 在 统计 串 长 时 还 要 注意 空格 的 影响 。 

表 6-1 是 部 分 字符 的 ASCII 码 表 。 


表 6-1 部 分 字符 的 ASCII 码 表 


字符 (空格 )| 0 1 2 3 4 5 6 了 8 9 

ASCII 码 32 48 49 50 51 52 53 54 55 56 57 
字符 A B C D E F G H I J K 

ASCII 码 65 66 67 68 69 70 ?1 72 73 74 75 
字符 L M N O P Q R S 党 TU V 

ASCII 码 76 77 78 79 80 81 82 83 84 85 86 
字符 Ww X ¥ 区 a b c d 已 f g 

ASCII 码 87 88 89 90 97 98 99 100 101 102 103 
字符 h i j k 1 m n oO p q [3 

ASCII 码 104 105 106 107 108 109 110 by 112 113 114 
字符 S t u V w 3 y 也 

ASCII 码 115 116 117 118 119 120 121 122 


例 6-1 下 面 的 字符 串 分 别 有 不 同 的 长 度 。 


string01 = "abcdefgABCDEFG123456789" (ASCII 码 字符 ,长 度 为 23) 
string02="abcdefgABCDEFG123456789"”( 全 角 字 符 ,长 度 为 46) 

string03 = "I like data structurel" (ASCII 码 字 符 ,长 度 为 22) 

string04 = "DATA STRUCTURE IS CHARMING." (ASCII 码 字 符 ,长 度 为 27, 注意 标点 符号 ) 
string05 = "数据 结构 充满 魅力 " (全 角 汉 字 , 长 度 为 16) 


当 串 长 为 0 时 , 称 为 空 串 。 含 有 一 个 空格 的 串 , 称 为 空白 串 , 它 的 长 度 为 1, 记 为 s=”“"。 

空格 并 不 是 没有 信息 ,相反 它 的 信息 量 很 大 ,例如 中 文 的 每 一 个 段落 开始 一 般 都 要 求 有 
两 个 空格 (当然 是 4 个 ASCII 码 字 符 )。 在 高 级 请 言 程序 设计 中 ,构造 要 素 之 间 一 般 也 是 用 
空格 分 隔 的 。 
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串 中 任意 连续 的 字符 组 成 的 子 序列 称 为 该 串 的 子囊。 包含 子 串 的 串 相应 地 称 为 主 串 。 
子 串 的 第 1 个 字符 在 主 串 中 的 序号 称 为 子 串 的 位 置 。 

两 个 串 相等 ,是 指 两 个 串 的 长 度 相等 且 对 应 字符 都 相等 。 

例 6-2 下 面 的 字符 串 分 别 有 不 同 的 长 度 。 


string01 = "12345" (ASCII 码 字 符 , 长 度 为 5) 
string02 = "12345 ” (因为 后 面 有 3 个 空格 ,所 以 长 度 为 8. 但 是 这 两 个 字 串 在 屏幕 上 特定 的 情况 
下 看 起 来 是 一 样 的 ) 


字符 串 的 比较 将 分 为 下 面 两 个 层次 进行 讨论 。 

ASCII 码 字符 串 的 比较 。 这 个 层面 涉及 两 个 概念 : ASCII 码 表 和 字典 序 。 首 先 约定 单 
个 字符 的 比较 是 基于 ASCII 码 表 中 符号 的 编号 大 小 。 如 a 二 b 二 cd 等 ,所 有 字母 都 比 空 
格 大 。 进 一 步 讨论 字典 序 ,这 里 的 字典 指 的 是 通常 的 “英语 字典 "。 在 字典 中 通常 约定 : 从 
第 一 个 字母 开始 比较 ,如 果 不 同 , 则 第 一 个 字母 大 的 单词 就 大 ,如 果 相 同 , 则 依次 比较 下 一 个 
字母 ,直到 不 等 的 情况 出 现 。 如 果 一 个 单词 全 部 比较 完了 ,另外 一 个 单词 还 有 字母 ,那么 根 
据 任 何 字母 比 空格 都 大 的 原则 ,可 判别 它们 的 大 小 。 如 果 两 个 单词 一 同 结束 且 每 个 字母 都 
相同 ,那么 就 符合 相等 的 定义 了 。 全 部 ASCII 码 字符 串 都 可 以 视 为 一 个 个 “单词 ,然后 根 
据 上 述 规则 进行 比较 即 可 。 

汉字 的 比较 。 对 于 汉字 由 于 本 身 是 象形 文字 ,约定 把 汉字 的 拼音 符号 存 人 计算 机 ,然后 把 
它 视 为 一 个 英语 单词 ,这 样 就 可 以 比较 。 根 据 这 个 比较 原则 ,显然 “ 李 四 ”<“ 王 五 ”<<“ 张 三 ”。 

对 于 字符 串 来 说 ,由 于 它 就 是 特殊 的 线性 表 , 一 方面 它 的 基本 操作 和 线性 表 完 全 一 样 , 另 
一 方面 由 于 它 在 应 用 方面 的 特点 ,会 把 一 个 “字符 串 ” 作 为 操作 的 基本 单元 ,很 多 时 候 它 关 注 的 
是 一 次 性 处 理 大 量 字符 。 在 线性 表 的 基本 操作 中 ,大 多 以 “单个 元 素 ” 作 为 操作 对 象 ,如 ,在 线 
性 表 中 查找 某 个 元 素 , 读 取 某 个 元 素 ,在 某 个 位 置 上 插入 一 个 元 素 和 删除 一 个 元 素 等 ; 而 在 串 
的 基本 操作 中 ,通常 以 “ 串 的 整体 "作为 操作 对 象 ,如 ,在 串 中 查找 某 个 子 串 , 读 取 一 个 子 串 ,在 
串 的 某 个 位 置 上 插入 一 个 子 串 以 及 删除 一 个 子 串 等 ,相应 地 程序 设计 也 会 发 生变 化 。 

例 6-3 文字 处 理 软件 中 要 提供 插入 一 个 字符 或 删除 一 个 字符 的 操作 ,但 是 如 果 只 有 
这 样 的 功能 就 会 造成 很 大 不 便 , 如 一 个 作家 正在 审阅 自己 的 小 说 ,决定 删除 中 间 一 段 不 大 理 
想 的 段落 ,由 于 这 一 段 有 10 000 多 个 汉字 ,那么 就 意味 着 必须 按 下 10 000 多 次 删除 键 ,显然 
这 是 很 不 方便 的 ,于 是 在 文字 处 理 软件 中 通常 都 会 提供 * 注 标 ? 处 理 , 可 以 很 容易 地 成 块 处 理 
大 批 字符 (如 剪 切 、 复 制 、. 粘 贴 .移动 等 ) 。 

字符 串 的 主要 操作 见 表 6-2 。 

表 6-2 字符 串 的 主要 操作 


操作 名 称 建议 算法 名 称 编程 细节 约定 
串 初 始 化 create(string) 
求 串 长 strlength( string) 返回 串 string 的 长 度 


stringl 是 一 个 串 变量 , string2 是 一 个 串 常 量 或 串 变 量 
(通常 string2 是 一 个 串 常 量 时 称 为 串 赋 值 , 是 一 个 串 变 
量 时 称 为 串 复制 )。 将 string2 的 串 值 赋值 给 stringl， 
string]l 原来 的 值 被 覆盖 掉 


串 赋值 Strassign(stringl,string2) 


操作 名 称 


建议 算法 名 称 


第 6 章 串 的 构造 与 应 用 


续 表 
编程 细节 约定 


串 连接 


strconcat ( stringl， 


string ) 或 strconcat (〈 stringl， 


string2) 


string2， 


两 个 串 的 连接 就 是 将 一 个 串 的 串 值 放 在 另 一 个 串 的 后 
面 ,连接 成 一 个 串 。 前 者 会 产生 新 串 string, stringl 和 
string2 不 改变 ; 后 者 是 在 stringl 的 后 面 连接 string2 
的 串 值 , stringl 改变 , string2 不 改变 。 例 如 : stringl 
一 "bei" , string2 一 ”jing", 前 者 操作 结果 是 string 一 
"bei jing" ,后 者 操作 结果 是 stringl1 二 "bei jing” 


求 子 串 


strsub(string ,i, len) 


串 string 存在 , 1 二 i<< strlength (string), 0 过 len 过 
strlength(string) 一 i 十 1。 返 回 从 串 string 的 第 i 个 字 
符 开始 的 长 度 为 len 的 子 串 。len=0 得 到 的 是 空 串 。 
例如 : strsub("abcdefghi" ,3,4) 一 "cdef" 


串 比 较 


Strcomp(stringl,string2) 


若 stringl 一 一 string2, 操 作 返 回 值 为 0; 若 string1 一 
string2, 返回 值 二 0; 若 stringl>string2, 返回 值 之 0 


子 串 定位 


strindex(string, substring) 


寻找 子 串 substring 在 主 串 string 中 首次 出 现 的 位 置 。 
车 substring 在 string 中 , 则 操作 返回 substring 在 
string 中 首次 出 现 的 位 置 ,否则 返回 值 为 一 1。 如 : 
strindex( " abcdebda" ," be") = 2, strindex ( " abcdebda", 
"ba") 王 一 1 


串 插 人 


strinsert(string,i，substring) 


串 string .substring 存在 ,1 二 i<strlength(string) 十 1。 
将 串 substring 插入 到 串 string 的 第 i 个 字符 位 置 上 


串 删 除 


strdelete( string ,i, len) 


串 string 存在 , 1 三 i<< strlength (string), 0 二 len 过 
strlength(string) 一 i 十 1。 删 除 串 string 中 从 第 i 个 字 
符 开始 的 长 度 为 len 的 子 串 


串 蔡 换 


strreplace ( string, substring01 ， 


substring02) 


串 string、substring01、substring02 存在 , substring01 
不 为 空 。 用 串 substring02 替换 串 string 中 出 现 的 所 
有 与 串 substring01 相等 的 不 重 又 的 子 串 


申 遍历 


strtraverse(string) 


把 字符 串 中 所 有 字符 从 头 至 尾 依次 输出 


有 的 高 级 语言 中 串 连 接 用 加 号 实现 , 则 要 注意 “123” 十 “456” 一 “123456”, 而 不 是 “579”。 


6.3 串 的 顺序 存储 


用 顺序 结构 存储 字符 串 称 为 "顺序 串 ”, 与 前 面 介绍 过 的 “顺序 表 ? 类 似 。 但 由 于 串 中 元 
素 全 部 为 字符 , 故 存放 形式 与 顺序 表 有 所 区 别 。 如 大 型 机 、 小 型 机 、 微 机 的 字 长 都 是 不 一 样 
的 ,所 以 有 一 些 影响 。 如 32 位 计算 机 :实际 上 谈 的 就 是 字 长 。 

串 的 非 紧缩 存储 。 一 个 存储 单元 中 只 存储 一 个 字符 ,与 顺序 表 中 一 个 元 素 占 用 一 个 存 
储 单元 类 似 。 如 果 字 长 超过 一 个 字符 需要 的 位 数 ,就 会 造成 一 些 浪费 ,但 是 编程 时 算法 和 线 
性 表 类 似 ,比较 简单 。 
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例 6-4 设 串 STRING 二 "I like data structure. "。 假 设 字 长 为 32 位 ,所 以 占用 了 22X 
32 一 704 位 ,而 一 个 字符 仅 需要 8 位 字 长 ,只 需要 22X8 王 176 位 ,每 一 个 字 要 浪费 24 位 ， 
一 共 浪 费 了 22X24 王 528 位 。 

串 的 紧缩 存储 。 根 据 计 算 机 字 长 , 尽 可 能 将 多 个 字符 存放 在 一 个 字 长 中 。 假 设 一 个 
字 32 位 ,可 以 存储 4 个 字符 , 则 紧缩 存储 可 以 做 到 充分 利用 空间 。 紧 缩 存储 能 够 节省 大 
量 存储 单元 ,但 对 串 的 操作 很 不 方便 ,编程 时 对 于 动态 操作 要 考虑 每 个 字 之 间 的 关系 , 涉 
及 不 同 单元 之 间 的 数据 移动 ,将 会 使 任何 操作 都 非常 困难 ,因而 需要 花费 更 多 的 处 理 
时 间 。 

串 的 字 节 存 储 。 计 算 机 常用 的 字 节 编 址 方式 是 一 个 字符 占用 一 个 字 节 。 一 般 正 好 是 
8 位 长 存储 8 位 长 的 ASCII 码 字 符 。 在 C 语言 中 ,为 了 表示 字符 串 的 结束 ,启用 了 结束 符 。 

整个 串 的 长 度 事先 要 固定 下 来 ,那么 如 何 标识 真实 长 度 呢 ? 有 以 下 几 种 方法 。 

定 尾 法 一 ,类 似 顺 序 表 , 用 一 个 指针 指向 最 后 一 个 字符 。 

定 尾 法 二 ,此 方法 就 是 在 串 尾 存 储 一 个 不 会 在 串 中 出 现 的 特殊 字符 作为 串 的 终结 符 , 以 
此 表示 串 的 结尾 。 在 C 语言 中 ,用 字符 “\0” 来 表示 串 的 结束 。 这 种 存储 方法 不 能 直接 得 到 
串 的 长 度 , 而 是 通过 判断 当前 字符 是 否 是 “"\0? 来 确定 串 是 否 结束 。 

以 下 为 顺序 串 功 能 演示 程序 源码 。 由 于 采用 数组 来 实现 顺序 表 , 操 作 又 多 为 字符 串 的 
处 理 , 会 导致 数据 大 量 的 移动 ,基本 上 是 顺序 表 相 关 程 序 的 变形 。 

在 顺序 存储 方式 下 , 串 插入 的 算法 可 以 用 线性 表 的 插入 算法 来 类 比 ,但 是 二 者 还 是 有 一 
些 细节 差异 ,如 对 于 溢出 的 判断 ,线性 表 里 在 放 满 数据 后 再 插入 才 会 溢出 ,而 插入 串 时 则 依 
赖 被 插入 串 的 长 度 。 插 和 人 时 引起 的 数据 移动 也 不 同 , 线 性 表 是 每 次 移动 一 个 位 置 , 是 个 常 
量 , 但 是 在 串 中 移动 的 距离 还 是 依赖 被 插入 串 的 长 度 , 因 为 要 腾 出 足够 的 空间 。 

在 顺序 存储 方式 下 , 串 替 换 将 变 得 比较 复杂 ,因为 并 没有 给 出 被 蔡 换 的 串 长 和 新 的 串 长 
的 限制 条 件 。 这 意味 着 可 以 是 串 长 相等 ,或 者 被 蔡 换 的 串 长 比 新 的 串 长 短 , 还 可 以 是 被 蔡 换 
的 串 长 比 新 的 串 长 更 长 ,这 3 种 情况 分 别 对 应 着 数据 修改 .数据 删除 .数据 插入 ,后 两 种 情况 
都 会 引起 数据 移动 ,这 也 说 明 顺 序 存 储 本 质 上 不 能 适应 串 的 应 用 。 

串 查找 算法 通常 称 为 “匹配 ?算法 ,启用 两 个 搜索 指针 同时 后 移 , 采 用 逐 位 比较 的 方式 
(BF 算法 ) ,在 某 个 字符 开始 的 字符 串 匹 配 失败 后 , 主 串 string 只 向 前 移动 一 个 位 置 ,匹配 串 
substring 则 要 回 到 第 一 个 字符 的 位 置 。 字 符 串 majiang 最 后 在 主 串 的 6 号 单元 匹配 成 功 ， 
如 图 6-1 所 示 。 


0 12345637.89101121314415 16 

string mlblmlalclmlalj i[aln[s[o[alo[o] 
012 34 56 7 8 
substring mlaljlilalnlsglo 


图 6-1 逐 位 比较 的 匹配 算法 示意 图 
【程序 源码 6-1】 顺序 串 的 基本 功能 ,提供 了 主要 操作 的 函数 。 
// 功 能 : 顺序 串 的 基本 功能 
# include < iostream.h> 


# include < conio.h> 
# include < windows.h> 
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# include < iomanip.h> 


# define maxsize 30 // 顺 序 串 的 总 空间 大 小 
enum returninfo{ success, fail, overflow, underflow, range_error, empty}; // 定 义 返 回信 息 清单 
// 串 对 象 设计 
class string 
{ 
public: 
string(); // 构 造 函 数 
~string(); // 析 构 函 数 
returninfo strcreate( ); // 创 建 串 
returninfo strinsert(int position, char newstr[ ], int str length); // 插 入 
returninfo strdelete( int beginposition, int endposition); // 删 除 
returninfo strmodify(int beginposition, int endposition, char newstr[ ]); // 修 改 
int strsearch(char newstr[ ]); // 查 找 
void strtraverse(); // 遍 历 
int strlength(); // 求 串 长 
Private: 
char * str; // 串 
int length; // 长 度 


}; 
string: :string() 
{ 
str = new char[ maxsize]; // 申 请 数组 空间 
} 
string: :~string() 
{} 
returninfo string: :strcreate( ) 
{ 
int i= -1,ch; 
cout <<" 请 输入 要 创建 的 字符 串 (ctrl + z 结束 输入 ):"<< endl; 
while((ch= getch())!= 26) 
{ 


cout << char(ch); 
t+ 
if(ch!= 13) 


str[i] = char(ch); 
else i=i-1; 
cout. flush(); // 为 了 每 次 输入 后 可 以 立即 显示 所 输入 的 字符 , 则 先 清除 缓冲 区 
} 
length=i+1; 
cout << endl; 
return success; 
returninfo string: :strinsert( int position, char newstr[ ], int str_length) 
// 当 插入 的 字符 串 在 原 串 末尾 时 ,就 相当 于 合并 
{ 
int j; 
if(position> length+1||position<= 0) // 如 果 位 置 错误 ,返回 错误 标志 
return range error; 
if(str length+ length> maxsize) 
return overflow; 
for(j=1length-1;j>= position—1;j--—) // 数 据 移 动 
str[j+ str length] = str[j]; 
position= position 一 17 
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for(j= 0;j< str_length;position+t+,j++) // 插 入 
str[position] = newstr[j]; 
length= str_length + length; 
return success; 
} 
returninfo string: : strdelete( int beginposition, int endposition) 
{ 
int i,j; 
if(length== 0) 
return empty; 
if(beginposition> length| | endposition > length| |beginposition <= 0| |endposition<= 0|| 
beginposition > endposition) 
return range_error; // 如 果 位 置 错误 则 返回 错误 标志 
for(i= beginposition, j = endposition;j < length;j++, i++) 
tr(i=1]= otc[d]; 
length = length— (endposition - beginposition + 1); 
return success; 
} 
returninfo string: :strmodify( int beginposition, int endposition, char newstr[ ]) 
{ 
int i,j,k,str_length, count, newlength, returnvalue; 
char * newdata; 
count = endposition - beginposition + 1; 
str_length = strlen(newstr) 7 
if(length== 0) 
return empty; 
if(beginposition> length| | endposition > length| |beginposition <= 0| |endposition <= 0|| 
beginposition > endposition) 


return range_error; // 如 果 位 置 错误 则 返回 
// 错 误 标志 
for(i= 0,j = beginposition-1;i<str_ length&&i<count;j++,i++)  // 处 理 相同 长 度 的 一 
// 部 分 


str[j] = newstr[i]; 
if(str_length> count) // 当 输入 串 的 长 度 大 于 需要 修改 串 的 长 度 时 ,处 理 后 面 多 的 一 部 分 
{ 
newlength= str_length— count; 
newdata = new char[newlength]; 
for(i=count,k=0;i<str length;i+t+,k++) 
newdata[k] = newstr[i]; 
returnvalue = strinsert(endposition + 1,newdata, newlength); 
if(returnvalue == overflow) 
return overflow; 
. 
if(str_length< count) // 当 输入 串 的 长 度 小 于 需要 修改 串 的 长 度 时 ,直接 删除 一 部 分 
strdelete(beginposition + str_length, endposition); 
return success; 
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int string: :strsearch(char newstr[ ]) 


{ 
int i=0, str_length, position = 0,count = 0; // 是 否 相 等 标志 , count 用 来 确定 比较 时 原 串 的 移动 
if(length== 0) 
return -1; 
str_length= strlen(newstr); 
for(;i< length&&count < str_length;i++) 
{ 
if(str[i] == newstr[count]) 
{position= i— str_length+ 2;count++;continue;} 
else 
{ 
if(position== 1) 
i=i- count; 
count = 0; 
position= 0; 
} 
} 
return position; 
} 
void string: :strtraverse() 
{ 
E 
if(length> 0) 
{ 
cout <<" 位 置 : "; 
for(i= 0;i<= Jength/10;i++) 
cout <<"| -- - "<< i<<" -- -—|"; 
cout << endl; 
cout <<" 位 置 : "; 
for(i=0;i<= length/10;i++) 
{ 
for(j=0;j<=9;j++) 
cout << j; 
} 
cout << endl; 
cout <<" 当前 串 : "; 
for(i=0;i<length;i+t+) 
cout << str[i]; 
cout << endl; 
} 
else 
cout <<" 字 符 串 为 空 ! "<< endl; 
} 
int string: :strlength() 
{ 
return length; 
} 
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图 6-2 为 顺序 串 常 用 功能 程序 的 运行 截图 。 


顺序 素 的 基本 功能 pr jE 本 砚 字 第 的 基本 功能 区 EA x | 
TF a <] 陋 序 后 基本 功能 茉 单 图 
。 1! ( 仅 限 单行 的 字符 串 ， 建 议 不 用 汉字 。) | : ( 仅 限 单行 的 字符 串 ， 建 议 不 用 汉字 。) 


3 


B1234567898123456789 
abcdef ghijklnnop 
lt 续 


6-2 ”顺序 串 常 用 功能 程序 的 运行 截图 


6.4 串 的 链接 存储 


用 链表 结构 处 理 字符 串 会 出 现 较 多 的 问题 。 如 每 个 结 点 为 一 个 字符 ,链表 的 操作 很 容 
易 实 现 ,但 缺点 是 过 于 浪费 空间 ,每 个 字符 都 要 占用 一 个 链 域 ,但 是 全 角 字 符 或 汉字 无 法 存 
储 , 所 以 通常 没有 实用 价值 。 

为 了 提高 存储 效率 ,和 紧缩 存储 类 似 , 假 设 一 个 结 点 中 的 数据 域 可 以 存储 K 个 字符 (如 
K 一 4), 则 一 个 结 点 有 个 数据 域 和 一 个 指针 域 ,最 后 一 个 结 点 中 数据 少 于 K 个 时 ,把 剩 
余 的 数据 域 用 O 代替。 在 提高 存储 效率 的 情况 下 ,牺牲 了 编程 的 简洁 性 ,在 进行 数据 的 插 
和 信和 删除 中 ,会 引起 不 同 结 点 之 间 的 数据 交换 ,如果 想 编制 出 通用 的 程序 将 十 分 困难 ,所 以 
也 没有 太 大 的 实用 价值 。 

因为 顺序 存储 和 链接 存储 都 有 较 大 的 次 病 ,所 以 在 处 理 串 的 过 程 中 ,提出 了 “索引 
存储 ”。 


6.5 串 的 索引 存储 


索引 存储 的 思想 如 同一 本 书 的 目录 ,有 了 目录 就 可 以 很 快 地 找到 想 阅 读 的 章节 。 索 
引 存储 就 是 在 原始 数据 外 增加 一 些 管理 数据 , 合 在 一 起 构成 一 种 存储 结构 , 既 保 存 了 数 
据 , 又 保持 了 关系 ,而 且 在 实用 中 会 有 很 大 的 方便 性 。 但 是 它 与 书 的 目录 不 一 样 的 是 ,在 
计算 机 中 如 果 丢 失 了 索引 ,可 能 连 原 始 数据 也 看 不 到 了 ,索引 是 访问 这 些 数 据 的 唯一 正 
常 途径 。 

索引 存储 ( 即 串 名 的 存储 映像 ) 是 用 串 变 量 的 名 字 作 为 关键 字 组 织 名 字 表 ( 即 索 引 表 )， 
该 表 中 存储 的 是 串 名 和 串 值 之 间 的 对 应 关系 。 名 字 表 中 包含 的 项 目 根据 不 同 的 需要 来 设 
置 ,只 要 为 存 取 串 值 提供 足够 的 信息 即 可 。 

如 果 串 值 是 以 链接 方式 存储 的 , 则 在 名 字 表 中 只 要 存 和 人 串 名 及 其 串 值 的 链表 的 头 指针 即 可 。 

如 果 串 值 是 以 顺序 方式 存储 的 , 则 在 表 中 除了 存 和 指示 串 值 存放 的 起 始 地 址 首 指针 外 ， 
还 必须 有 信息 指出 串 值 存放 的 末 地 址 。 末 地 址 的 表示 方法 有 几 种: 四 给 出 串 长 。 回 设置 尾 
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指针 直接 指向 串 值 末 地 址 。@ 在 串 值 末尾 设置 结束 符 。 
常见 的 “ 串 名 - 串 值 存储 映像 索引 表 ” 有 如 下 几 种 。 
Oz 带 串 长 度 的 索引 表 ,示意 图 见 图 6-3。 
@ 带 末 尾 指针 的 索引 表 ,示意 图 见 图 6-4。 


name startaddress length name startaddress endaddress 
string01 4 string01 
string02 3 string02 | 
alblcldlx|ly|z …| “中 引 基 ,到 医 :加 区 :加 区 二 区 二 区 -< 加 
图 6-3 带 串 长 度 的 索引 表示 意图 图 6-4 带 末 尾 指针 的 索引 表示 意图 
下 面 介绍 一 种 变形 ,把 较 短 的 字符 串 存 人 索引 name tag startaddress 
表 之 中 ,但 这 时 要 加 一 个 特征 位 tag 以 指出 指针 域 [swing | 0 


中 存放 的 是 指针 还 是 串 。 sting02 4 ya0 
@ 带 标志 位 的 索引 表 , 示 意图 见 图 6-5。 2 2 人 
在 内 存 中 处 理 大 量 字符 串 时 ,通常 把 这 种 索引 一 四 


结构 称 为 堆 结构 。 其 基本 思想 是 : 在 内 存 中 开辟 能 aelalw 
存储 足够 多 的 串 、. 地 址 连续 的 存储 空间 作为 所 有 串 。 图 6-5 带 标志 位 的 索引 表示 意图 
的 可 利用 存储 空间 , 称 为 堆 空间 。 根 据 每 个 串 的 长 
度 ,动态 地 为 每 个 串 在 堆 空 间 申 请 相应 大 小 的 存储 区 域 , 串 顺序 存储 在 所 申请 的 存储 区 域 
中 ,操作 过 程 中 若 原 空间 不 够 ,可 以 根据 串 的 实际 长 度 重新 申请 ,复制 原 串 值 后 存 人 一 片 新 
的 地 址 。 开 始 时 所 有 串 放置 的 次 序 和 他 辑 次 序 完全 一 致 ,类 似 线性 表 的 顺序 存储 。 随 着 不 
断 编辑 演变 ,所 有 语句 的 次 序 已 经 凌乱 ,并 且 在 中 间 有 许多 字符 串 已 经 不 属于 用 户 的 数据 
了 ,这 部 分 空间 实际 上 也 是 可 以 重新 分 配 的 ,下 面 为 了 简化 讨论 ,需要 新 的 空间 时 一 律 到 最 
后 面 连续 的 空闲 区 申请 。 

堆 存 储 结构 示意 图 见 图 6-6 。 


stringstore stringstore 
一 |]- Ti 
国 国 <- a 
(a) 堆 初始 化 ,第 一 次 存 入 一 批 数据 的 效果 (b) 堆 反复 进行 插入 删除 操作 后 的 效果 


图 6-6 堆 存 储 结构 示 意图 


图 中 黑色 部 分 是 正在 被 串 占 用 的 空间 ,free 为 未 分 配 空间 的 起 始 地 址 , 随 着 不 断 地 插入 
删除 操作 , 堆 中 的 空间 变 成 了 有 许多 “空洞 ,物理 次 序 也 不 一 定 对 应 逻辑 次 序 的 效果 ,向 
stringstore 中 存放 一 个 串 时 ,要 修改 相应 的 索引 项 。 具 体 的 修改 规则 如 下 。 

约定 除了 单个 字符 和 多 个 字符 外 , 源 程序 中 每 行 也 是 字符 串 处 理 的 基本 单位 。 对 于 存 
储 源 程序 字符 串 的 基本 操作 规则 如 下 。 
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1. 字符 级 别 

(1) 插入 。 数 据 区 中 申请 空闲 区 存储 原 串 插 和 人 新 字符 后 的 整 行 字符 串 , 索 引 表 中 修改 
起 始 地 址 和 串 长 。 

(2) 删除 。 数 据 区 中 删除 的 字符 用 该 行 中 该 字符 后 的 所 有 字符 前 移 覆 盖 , 在 索引 表 中 
修改 串 长 。 

(3) 修改 。 数 据 区 中 直接 找到 地 址 修改 某 个 字符 ,索引 表 不 变 。 

2. 字符 串 级 别 

(1) 插入 。 数 据 区 中 申请 空闲 区 存储 原 串 插入 新 字符 串 后 整 行 字符 串 ,索引 表 中 修改 
起 始 地 址 和 串 长 。 

(2) 删除 。 数 据 区 中 删除 的 字符 串 用 该 行 中 该 字符 后 的 所 有 字符 前 移 覆 盖 , 在 索引 表 
中 修改 串 长 。 

(3) 修改 。 


Q@ 如 果 长 度 相 等 , 则 数据 区 中 直接 替换 ,索引 表 不 变 。 

@ 如 果 比 原来 长 , 则 在 数据 区 中 重新 申请 空闲 区 来 放 修改 后 的 字符 串 ,索引 表 中 改变 
起 始 地 址 和 串 长 。 

@ 如 果 比 原来 短 , 则 在 数据 区 中 将 字符 串 替 换 掉 ,后 面 还 有 字符 串 则 前 移 ,索引 表 中 改 
变 串 长 。 

3. 行 级 别 

(1) 插入 。 数 据 区 中 申请 空闲 区 来 存储 插入 的 新 行 ,在 索引 表 中 按照 排序 效果 插 和 人 新 
的 索引 项 , 填 人 正确 的 行 号 .起 始 地 址 和 串 长 。 如 果 用 顺序 表 存 储 索 引 表 ,这 个 操作 可 能 引 
起 索引 表 中 数据 的 移动 , 则 可 以 考虑 索引 表 使 用 链表 来 实现 。 

(2) 删除 。 数 据 区 中 不 变 , 索 引 表 中 删除 该 索引 项 。 

(3) 修改 。 由 于 通常 不 会 整 行 修改 ,所 以 行 的 修改 可 以 被 删除 行 和 插入 行 代替 ,不 用 单 
独 编程 实现 。 

以 下 为 某 段 含有 错误 的 代码 段 及 编辑 为 正确 代码 的 过 程 。 在 内 存 中 用 编号 法 给 每 个 字 
符 串 命名 ,为 了 插入 行 更 方便 ,从 100 开始 ,采用 间隔 法 命名 。 由 于 字符 串 等 长 修改 和 字符 
的 修改 基本 原理 一 致 ,字符 串 的 删除 和 字符 的 删除 基本 原理 一 致 ,所 以 只 讨论 其 中 一 种 。 简 
化 起 见 , 回 车 符 约定 一 个 字符 。 


错误 代码 编辑 后 希望 的 正确 代码 
100 | #include<bcdream.h> // 字 符 串 的 修改 ,新 串 更 长 100 | #include< iostream.h> 
200 | void nein() // 字 符 串 等 长 修改 200 | void main() 
300 | 1 300 |{ 
400 char x,y; // 字 符 串 的 修改 ,新 串 长 度 

// 比 旧 串 的 短 SO | ny 
// 缺 少 s 的 定义 , 行 插入 4 nt 
500 cin> x>>y; 500 cin>x>y; 
600 if(x>y) 600 if(x>y) 
700 S++; // 行 的 删除 8o0 s=x-y; 
800 一 // 字 符 串 的 插入 8 I 
900 s=—x; // 字 符 的 插入 y 
1000 cout << s << enmdl; // 字 符 的 删除 1000 CS Se 
1100 |} 1100 | } 
IE 


堆 空 间 的 初始 状态 如 下 表 所 示 。 


第 6 章 串 的 构造 与 应 用 


00 01 02 03 04 05 06 07 08 09 
# i n c 1 u d e x b 
10 11 12 13 14 15 16 17 18 19 
€ d r e a m h > Pa 
20 21 22 23 24 25 26 27 28 29 
V o i d a n , i n ( 
30 31 32 33 34 35 36 37 38 39 
) HP# { nl ee e h a r 
40 41 42 43 44 45 46 47 48 49 
本 x » y 了 有 © i 
50 51 52 53 54 55 56 57 58 59 
> > x 2 > y ; x - 
60 61 62 63 64 65 66 67 68 69 
bt i f ( x > y ) PA a 
70 71 72 73 74 75 76 77 78 79 
本 各 s 十 十 ~ 国 | 国 
80 81 82 83 84 85 86 87 88 89 
S 全 x a y 了 PA a a s 
90 91 92 93 94 95 96 97 98 99 
= 一 x $ PA nd ed c 0 u 
100 101 102 103 104 105 106 107 108 109 
t < < s - < e n m d 
110 111 112 113 114 115 116 117 118 119 
1 了 Pa } A 
串 的 索引 表 初 始 状态 如 下 表 所 示 。 
串 名 串 头 位 置 串 长 
100 00 20 
200 20 12 
300 32 2 
400 34 12 
500 46 13 
600 59 10 
700 69 9 
800 78 9 
900 87 8 
1000 95 18 
1100 113 2 
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通过 下 面 的 操作 逐步 将 程序 改正 。 
经 过 多 轮 修改 后 的 堆 空 间 的 状态 如 下 表 所 示 。 
00 01 02 03 04 05 06 07 08 09 
# i n [2 1 u d e 二 b 
10 11 12 13 14 15 16 17 18 19 
e d [2 e a m h > Pa 
20 21 22 23 24 25 26 27 28 29 
v o i d bi m a i n ( 
30 31 32 33 34 35 36 37 38 39 
) [4 { wp bd 和 ii 
40 41 42 43 44 45 46 47 48 49 
x ， y 了 PA x i bn e i 
50 51 52 53 54 55 56 57 58 59 
n > > 是 > > y ; Pa sy 
60 61 62 63 64 65 66 67 68 69 
A i f ( 活 -2 y ) Pa 
70 71 72 73 74 75 76 77 78 79 
ed 号 = s 十 st st 
80 81 82 83 84 85 86 87 88 89 
S ee 二 a y Pe ba St S 
90 91 92 93 94 95 96 97 98 99 
一 一 x 了 Pd Wp md c 0 u 
100 101 102 103 104 105 106 107 108 109 
t < < S < es e n d 1 
110 111 112 113 114 115 116 117 118 119 
; [4 } A # i n 3 1 
120 121 122 123 124 125 126 127 128 129 
u d e < i O S 家 各 
130 131 132 33 134 135 136 137 138 139 
a m h > pi had be i n 
140 141 142 143 144 145 146 147 148 149 
t bond s 了 Pa Sd a bt s 
150 151 152 153 154 155 156 157 158 159 
村 x Eg 3 人 i St s 一 
160 161 162 163 164 165 166 167 168 169 
y 一 x ; x 
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多 轮 修改 后 串 的 索引 表 状 态 如 下 表示 。 


串 名 串 头 位 置 串 长 
100 115 21 
200 20 12 
300 32 2 
400 34 11 
450 136 9 
500 46 13 
600 59 10 
800 145 11 
900 156 9 

1000 95 17 
1100 113 2 


从 最 后 的 堆 空 间 和 索引 表 可 以 看 出 ,语句 原来 的 逻辑 次 序 在 存储 空间 里 已 经 乱 序 ,而且 
中 间 有 许多 已 经 废弃 的 空间 ,数据 区 本 身 并 不 是 顺序 存储 ,也 不 是 链接 存储 ,但 是 数据 在 编 
辑 过 程 中 特别 是 插入 和 删除 操作 已 经 最 大 限度 解决 了 数据 移动 的 问题 。 根 据 最 后 的 索引 表 
和 数据 区 的 数据 ,可 以 读 出 下 面 正确 的 字符 串 。 


# include < iostream.h> 
void main() 
{ 

int x,y; 

int s; 

cin>x>y; 

if(x>y) 

s=x-y; 
S=Y 一 Xi 
cout << s << endl; 


} 


【程序 源码 6-2】 索引 结构 的 基本 功能 程序 的 部 分 源码 如 下 。 主 要 提供 了 字符 串 的 
3 种 基本 操作 。 


// 串 的 索引 结构 

# include < STDIO.H> 

# include < IOSTREAM. H> 

# include < FSTREAM.H> 

# include < WINDOWS. H> 

# include < STRING.H> 

# include < IOMANIP.H> 

# include < STDLIB.H> 

# define Maxsize Heap 1000 
# define Maxsize Line 80 

# define Maxsize Filename 20 
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# define Maxsize _ Message 30 
char Msg_1[Maxsize_Message] = "修改 完毕 !"; 
char Msg_2[Maxsize_Message] = "删除 完毕 !"; 
char Msg_3[Maxsize_Message] = "插入 完毕 !"; 
char Msg_4[Maxsize_Message] = "请 输入 正确 的 选择 !"; 
char HeapSpace[ Maxsize Heap] = {'0'}; 
char * FreeSpace = HeapSpace; 
FILE * profile; 
int HeapCounter = 0; 
// 索 引 表 对 象 设计 
class Index 
{ 
public: 
Index(); 
~Index(); 
int number; 
char * fstr; 
int length; 
int hpstr; 
Index * next; 
}; 
// 字 符 串 级 操作 
V xxx 修改 操作 *xx / 
Index* String Modify(Index * nownode) 
{ 
char * firads = nownode 一 > fstr; 
int sposition, fposition; 
int i,j; 
char newstr[Maxsize Line] = {'0'}; 
unsigned int leng; 
cout <<" 请 输入 需要 修改 字符 串 的 起 始 和 结束 位 置 :"; 
cin >> sposition 之 fposition; 
cout <<" 请 输入 需要 插入 的 字符 串 :"; 
cin>> newstr; 
leng = fposition— sposition+ 1; 
/* -———- 新 旧 字符 串 相等 ---- */ 
if (leng == strlen(newstr)) 
人 
for (i=0,j=0;i<nownode—> length;i++) 


{ 
if (i== sposition 一 1) 
{ 
do 
{ 
firads[i++] = newstr[j++]; 
} while (j<(int)leng); 
} 
firads[i] = firads[i]; 
} 


nownode — > fstr = firads; 


// 堆 空间 

//free 区 

// 用 于 显示 修改 后 的 文本 信息 
// 堆 空间 已 使 用 大 小 计数 器 


// 行 编号 

// 字 符 串 首 地 址 

// 字 符 串 长 度 

// 字 符 串 起 始 地 址 在 堆 空间 编号 
// 结 点 指针 


// 要 修改 字符 串 的 起 始 、 结 束 位 置 


// 接 收 新 字符 串 


// 要 求 改 字符 串 的 长 度 


// 找 到 要 求 改 字符 串 的 开始 位 置 


// 执 行 新 串 覆盖 旧 串 操作 


// 无 须 修改 的 地 方 直接 复制 


// 更 新 字符 串 首 地 址 
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} 
/* ---- 新 字符 串 长 度 小 于 旧 字 符 串 ---- * / 
if (leng > strlen(newstr) ) 


{ 
for (i=0,j=0;;i+t+) // 完 成 第 一 段 旧 串 及 新 串 的 连接 
{ 
if (i== sposition— 1) 
{ 
do 
{ 
firads[ i++ ] = newstr[j++]; 
} while (j<(int)strlen(newstr)); 
break; 
} 
firads[i] = firads[i]; 
} 
for (j= fposition- 1;j<= nownode-> length;j++)  // 完 成 第 二 段 旧 串 的 连接 
firads[ i++] = firads[j]; 
} 
nownode -> length -= (leng- strlen(newstr) - 1); // 更 新 字符 串 的 长 度 
nownode -> fstr = firads; 
} 


/* ---- 新 字符 串 长 度 大 于 旧 字 符 串 ----*/ 
if (leng < strlen(newstr) ) 
{ 
for (i=0,j=0)7i++) 
if (i== sposition 一 1) 
{ 
do 
{ 
FreeSpace[ i++ ] = newstr[ j++ ]; 
} while (j <(int)strlen(newstr)); 
break; 
} 
FreeSpace[ i] = firads[i]; // 在 free 区 存放 修改 后 的 内 容 
} 
for (j= fposition- 1;j<nownode— > length; j++) 
{ 
FreeSpace[ i++ ] = firads[j]; 
} 
nownode 一 > fstr = FreeSpace; 
nownode 一 > hpstr = HeapCounter; 
nownode -> length+= (strlen(newstr) -~ leng + 1); 
FreeSpace = &FreeSpace[ i]; 
HeapCounter += i; 
} 
return nownode; 
} 
/xxx 删除 操作 xxx / 
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Index* String Delete(Index * nownode) 


{ 


} 


char * firads = nownode 一 > fstr; 
int sposition, fposition; 
i 3 
cout <<" 请 输入 需要 删除 字符 串 的 起 始 和 结束 位 置 :"; 
cin>> sposition >> fposition; 
for (i=0,j=0;i<nownode—> length;i++) 
人 

if (i== sposition— 1) 

{ 

i= fposition; 

} 

firads[j++] = firads[i]; 
} 
nownode — > fstr = firads; 
nownode - > length—= (fposition— sposition + 1); 


return nownode; 


/xxx 插入 操作 xxx / 
Index* String_insert(Index * nownode) 


{ 


char * firads = nownode 一 > fstr; 
int position, i,j,k; 
char newstr[Maxsize Line]; 
cout <<" 请 输入 插入 字符 串 的 起 始 位 置 :"; 
cin>> position; 
cout <<" 请 输入 新 的 字符 串 :"; 
Cin >> newstr; 
for (i=0,j=0,k=0;i<nownode—> length;i++) 
{ 
if (i== position—1) 
{ 
do 
{ 
FreeSpace[k++] = newstr[ j++ ]; 
} while (j<(int)strlen(newstr)); 
break; 
} 
FreeSpace[k++] = firads[i]; 
} 
for (;i<nownode—> length;i++) 
{ 
FreeSpace[k++] = firads[i]; 
} 
nownode 一 > fstr = FreeSpace; 
nownode -> length+= strlen(newstr); 
nownode 一 > hpstr = HeapCounter + 1; 
FreeSpace = &FreeSpace[k]; 
HeapCounter += k; 
return nownode; 
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图 6-7 为 串 的 索引 结构 程序 运行 图 。 


件 请 取 完 年 ， <“ 
叭 宝 间 中 的 数据 如 下 : 
和 2 3 4 5 6 7 8 9 
主 n ec 1 u a e < b 
te it 12 13 14 15 16 17 148 19 
a r e a nm h > / 
0 21 22 23 24 25 26 27 28 29 
o 和 a 本 n e 主 n 《 
a 31 32 33 34 35 36 37 38 39 
/ < / 和 e @ h a 下 
44 42 43 44 4 46 47 48 49 
x 2» y 了 / » 可 ce 主 | 
9 S51 S52 S53 54 55 56 57 58 S59 
> > x > > y 3 / 
| 61 62 63 64 65 66 67 68 69 
主 £ x > y > / * 
71 ?2 ?3 ?4 7 7 77 ?8 ?9 
s 人 全 了 二 考 s 四 
a 81 82 83 84 85 86 87 88 89 
= y 了 / 的 s = = 
@ 91 92 93 94 95 9%6 97 9%8 99 
上 了 ’ by _ c o u 二 < 
hoo i191 1692 163 164 165 186 197 198 199 
k < < e n m a 1 5 
19 111 112 113 114 115 116 117 1l8 119 
! > » 
人 =============================================== 医 
到 信息 漠 并 位置 串 长 
89 日 28 
99 29 12 
a 32 2 
oo 34 12 
a0 46 13 
a0 59 18 
0 69 7 
69 ?6 ba 
99 85 8 
5 93 18 
199 111 2 
引 存 依 
#includeChcdrean.h> 
69 void nein5》 | 
00 <€ | 
99 char x-93 | 
a0 cin>>x>>93 | 
69 if Cx7y) 
69 3 | 
99 —y3 
69 3 
999 cout<<s<<enmdal3 
100 > | | 


图 6-7 串 的 索引 结构 程序 运行 图 
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这 是 综合 利用 数据 结构 思想 解决 实际 问题 的 最 好 案例 。 除 了 内 存 中 可 以 这 样 处 理 数 据 
外 ,外 存 的 数据 更 需要 类 似 管理 。 只 有 运用 了 索引 结构 ,计算 机 存储 才能 到 达 真 正 的 实用 阶 
段 。Windows 操作 系统 的 文件 管理 就 类 似 这 里 的 索引 结构 ,操作 系统 中 提供 的 磁盘 整理 操 
作 就 是 把 不 连续 的 数据 区 重新 整理 成 连续 空间 以 提高 访问 数据 的 速度 。 


6.6 串 的 应 用 案例 


【应 用 案例 6-1】 程序 设计 中 使 用 字符 串 。 在 程序 设计 中 ,很 多 情况 下 必须 使 用 字符 
串 。 如 所 有 的 屏幕 提示 即 是 一 些 字符 串 原 样 显示 在 屏幕 上 的 效果 ,又 如 所 有 的 内 部 注释 , 虽 
然 它 们 不 被 编译 和 执行 ,但 是 本 质 也 是 字符 串 。 从 编译 角度 看 所 有 的 变量 名 、 函 数 名 等 开发 
者 使 用 的 名 称 也 都 是 字符 串 ,从 文件 系统 角度 看 ,整个 程序 也 都 是 字符 串 。 

【应 用 案例 6-2】 手机 短信 。 短 信也 是 一 种 字符 串 ,看 起 来 它 的 载体 似乎 不 是 计算 机 ， 
但 是 都 必须 用 计算 机 进行 管理 ,也 就 是 必须 通过 程序 来 操控 这 些 字符 串 。 

【应 用 案例 6-3】 密 电 码 的 传输 。 军 事 上 常用 的 密 电 码 文件 也 是 一 种 字符 串 , 只 不 过 
这 种 字符 串 比较 特殊 , 它 是 原 字 符 串 的 加 密 形式 。 


6.7 本 章 总 结 


本 章 主要 介绍 了 串 的 多 辑 结构 ,存储 结构 和 基本 操作 的 程序 设计 ; 通过 图 示 展 示 了 串 
的 各 种 存储 原理 ,给 出 了 多 个 应 用 范例 ; 较为 详细 地 讨论 了 索引 存储 ,给 出 了 其 工作 原理 示 
意图 。 

索引 存储 实际 上 是 结合 了 顺序 存储 和 链接 存储 两 种 存储 结构 的 优点 ,但 是 付出 了 一 些 
空间 的 代价 和 管理 上 的 时 间 代 价 , 这 种 代价 是 值得 的 , 它 带 来 了 一 种 很 实用 的 数据 管理 方 
式 。 值 得 深入 学 习 和 研究 。 


习 题 


一 、 原理 讨论 题 

. 字符 串 和 线性 表 的 关系 是 什么 ? 

. 字符 串 的 操作 主要 体现 在 什么 方面 ? 

. 为 什么 常规 的 存储 结构 不 能 适应 串 的 处 理 ? 

. 索引 存储 的 特点 和 优点 ? 

、 理 论 基 本 题 

. 写 出 以 下 概念 的 定义 : 串 、 串 长 、 空 串 、 空 白 串 、 串 相等 、 串 比较 大 小 。 

. 写 出 主要 的 串 的 操作 清单 。 

. 在 C 语 言 中 , 找 出 10 种 标准 的 字符 串 函数 (不 是 本 书 中 的 基本 操作 )。 
. 画 出 几 种 存储 结构 的 示意 图 。 

. 画 出 索引 存储 结构 的 工作 示意 图 。 建 议 用 计算 机 制作 ,用 一 个 小 的 程序 段 的 编辑 过 
程 体现 索引 表 的 工作 原理 。 


iT 守 


wD 
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三 、 编 程 基本 题 

1. 用 顺序 存储 的 思路 编程 进行 串 的 基本 操作 演示 系统 。 

2. 用 链接 存储 的 思路 编程 进行 串 的 基本 操作 演示 系统 。 

3. 英文 文本 统计 系统 。 具 体 要 求 : 文本 在 test. txt 文件 中 。 主 要 功能 : 统计 单词 数 、 
句子 数 .总行 数 .总 空 行 数 、. 段 落 数 。 高 级 功能 : 统计 每 个 单词 的 出 现 次 数 和 所 在 行 号 。 

四 、 编 程 提高 题 

1. 简易 的 文字 处 理 软件 。 可 以 不 考虑 如 何 存储 在 外 存 上 ,但 是 在 软件 启动 后 可 以 进行 
文字 的 输入 .显示 插入、 删除 等 操作 。 

2. 编程 把 任何 一 句 英语 加 密 变 成 密语 ,然后 写 出 解密 的 程序 。 

3. 从 文件 中 读 入 英语 文章 ,把 其 中 的 英语 单词 梳理 出 来 ,去 掉 重 复 的 ,再 进行 排序 。 结 
果 输 出 到 另外 的 文件 中 。 

4. 编程 实现 索引 结构 的 8 种 修改 过 程 ,可 以 显示 内 存 示意 图 .索引 表 、 带 行 号 的 字符 串 
内 容 、 实 际 编辑 后 的 效果 ,初始 文本 从 文件 读 入 ,结果 数据 写 人 另外 的 文本 文件 中 。 

五 、 思 考题 

在 计算 机 处 理 数据 时 ,很 多 情况 下 都 要 把 实体 进行 编号 ,如 学 号 、 职 工 编号 ,设备 编号 。 
还 有 在 处 理 电 话 号 码 时 ,将 这 些 信 息 数 据 化 之 后 ,应 该 是 字符 串 还 是 整数 ,主要 理由 是 什么 ? 
各 自 的 优 缺 点 是 什么 ? 
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构造 与 应 用 


本 章 主 要 介绍 第 五 种 数据 结构 一 一 二 维 数组 ,以 及 它 的 迎 辑 结构 .存储 结构 的 实现 , 讨 
论 二 维 数组 基本 操作 的 程序 设计 ,介绍 几 种 特殊 矩阵 的 压缩 存储 方案 。 二 维 数组 主要 用 于 
构造 同时 具有 横向 和 纵向 关系 或 简单 的 平面 二 维 关系 ,可 以 解决 很 多 编程 难题 ,也 为 后 面 的 
图 的 存储 结构 打下 基础 。 本 章 还 简要 介绍 广义 表 , 它 可 以 被 视 为 特殊 的 二 维 数组 ,也 为 后 面 
的 非 线性 结构 打下 一 个 基础 。 


7 引 言 


任何 高 级 语言 都 提供 了 二 维 数组 的 数据 类 型 , 它 比 一 维 数组 提供 的 一 维 线性 关系 表达 
能 力 更 强大 ,本 章 把 它 作为 一 种 数据 结构 进行 深入 讨论 。 虽 然 本 章 讨论 的 二 维 数组 与 高 级 
语言 中 的 二 维 数组 名 称 一 样 ,但 是 讨论 的 层面 不 一 样 。 高 级 语言 主要 学 习 语 法 格式 和 编程 
实现 , 即 如 何 使 用 二 维 数组 ,而 数据 结构 关注 的 是 其 内 部 的 数据 关系 以 及 存储 方法 , 即 如 何 
实现 二 维 数 组 。 数 据 结构 的 二 维 数组 可 以 用 高 级 语言 中 的 二 维 数组 编程 实现 ,也 可 以 用 链 
表 等 其 他 存储 结构 编程 实现 。 

从 数学 层面 观察 二 维 数组 , 它 就 是 矩阵 ,是 一 个 具有 固定 行 数 和 列 数 的 阵列 形式 。 关 于 
矩阵 的 所 有 知识 都 是 本 章 数据 结构 的 数学 基础 ,也 是 学 习 本 章 之 后 程序 设计 必须 考虑 的 
因素 。 

如 果 把 固定 行 数 和 列 数 的 限制 打开 ,就 构成 了 所 谓 的 广义 表 , 它 是 最 复杂 的 线性 结构 ， 
同时 也 可 以 视 为 非 线性 结构 。 


7.2 二 维 数组 的 逻辑 结构 


二 维 数组 是 一 个 具有 固定 格式 和 长 度 ( 即 数 据 个 数 ) 的 数据 有 序 集 ,每 一 个 数据 元 素 由 
一 组 下 标 ( 行 下 标 和 列 下 标 ) 来 标识 ,除了 边界 元 素 外 任何 一 个 元 素 都 有 两 个 方向 的 直接 前 
趋 和 直接 后 继 ,通常 约定 往 左 和 往 上 是 直接 前 趋 关 系 , 往 右 和 往 下 是 直接 后 继 关 系 。 边 界 和 
4 个 角落 的 数据 为 特例 ,总 有 某 些 直接 前 趋 或 直接 后 继 是 不 存在 的 。 
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图 7-1 是 二 维 数组 的 逻辑 结构 示意 图 ,表示 一 个 m 行 n 列 的 二 维 数组 ,可 以 看 出 它 和 数 
学 中 的 矩阵 是 相同 的 关系 模型 ,本章 讨论 的 二 维 数组 更 多 的 是 研究 它 的 程序 设计 。 
B21 B22 223 B24 0 an B21 az2 823 B24 …。 Ban 


831 82 33 834 … an Mm 831 a32 33 34 … aan 


anl an2 an3 an4  。…。 am anl an an3 an4 。…。 am 
(a) 数据 结构 二 维 数组 的 定义 (b) 高 等 数学 中 和 矩阵 的 定义 
7-1 二 维 数组 的 逻辑 结构 示意 图 


使 用 高 级 语言 编程 时 ,通常 要 求 静态 数组 在 使 用 之 前 先 定义 它 的 大 小 ,在 后 面 对 数 组 的 
使 用 中 每 一 维 的 大 小 及 上 下 界 是 不 能 改变 的 ,所 以 数组 中 通常 主要 做 下 面 两 种 操作 。 

(1) 取 值 操作 。 给 定 一 组 下 标 , 读 出 其 对 应 的 数据 元 素 。 

(2) 赋值 操作 。 给 定 一 组 下 标 , 存 储 或 修改 该 位 置 的 数据 元 素 。 

从 逻辑 上 看 ,二 维 数组 中 不 能 做 数据 的 插入 、 删 除 等 操作 ,因为 其 总 的 行列 数 要 求 是 固 
定 不 变 的 。 

数据 结构 中 二 维 数组 就 是 数学 矩阵 概念 的 编程 实现 ,是 从 计算 机 程序 设计 的 角度 对 数 
学 理论 的 具体 体现 ,当然 二 维 数组 可 以 实现 矩阵 运算 ,可 以 表示 数学 概念 行列 式 ,还 可 以 处 
理 诸如 棋盘 等 具有 二 维特 征 的 其 他 逻辑 关系 模型 。 在 不 产生 歧义 的 情况 下 ,本 书 也 使 用 “和 矩 
阵 ?表示 “二 维 数组 ”。 


7.3 二 维 数组 的 顺序 存储 


二 维 数组 在 计算 机 内 存 中 的 存储 并 不 体现 为 二 维 结构 ,最终 还 是 一 维 结构 ,总体 上 是 按 
照 行 的 方向 或 者 列 的 方向 逐一 处 理 所 有 数据 元 素 , 该 存储 方法 可 以 保证 全 部 数据 无 遗漏 地 
进行 存储 ,同时 还 具有 原来 的 二 维 关 系 属 性 ,其 中 任何 一 个 元 素 都 可 以 通过 地 址 计算 公式 很 
快 找到 和 使 用 。 

对 二 维 数组 进行 存储 时 , 逐 行 存储 的 方案 是 “ 行 优先 存储 法 , 逐 列 存储 的 方案 是 “ 列 优 
先 ” 存 储 法 。 行 优先 顺序 存储 法 是 一 行 存储 完毕 再 去 存储 下 一 行 ,同一 行 中 从 左 至 右 ,逐一 
处 理 。 高 级 语言 中 如 BASIC、Pascal、Cobol、C、C++ 等 都 用 行 优先 存储 法 。 

列 优先 顺序 存储 法 的 思路 与 行 优先 一 样 , 但 是 方向 改变 , 即 一 列 一 列 地 存储 。 高 级 语言 
中 如 FORTRAN 语言 用 的 就 是 “ 列 优先 ”存储 法 。 

图 7-2 是 一 个 3X3 的 二 维 数组 “ 行 优先 存储 "和 * 列 优先 存储 ?的 对 比 示意 图 。 以 行 优 
先 为 例 ,除了 边界 元 素 外 ,任何 一 个 元 素 的 横向 的 直接 前 趋 在 它 的 左边 的 相 邻 单元 中 ,横向 
的 直接 后 继 在 它 的 右边 的 相 邻 单元 中 ,纵向 的 直接 前 趋 在 它 的 向 左 偏 移 原 二 维 数组 总 列 数 
的 单元 中 ,纵向 的 直接 后 继 在 它 的 向 右 偏 移 原 二 维 数组 总 列 数 的 单元 中 ,虽然 用 一 维 结构 表 
示 , 但 是 其 二 维 关系 特征 完整 保留 。 至 于 边界 的 元 素 , 可 以 通过 总 列 数 的 倍数 等 信息 来 
体现 。 
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all 对 al3 pe aii -| 
A= | 1 € a22 > 323 aa al3 | 321 | 322 | 323 | 331 | 332 | 333 all | a21 | 331 | al2 | a22 | 332 | al3 | a23 | 333 
vy 有 aa 有 As 
831 B32 33 
(a) 9 个 元 素 的 矩阵 (b) 行 优先 时 访问 横向 和 纵向 数据 (b) 列 优先 时 访问 横向 和 纵向 数据 


图 7-2 二 维 数组 行 优先 、 列 优先 存储 的 示意 图 


对 于 m 行 n 列 的 二 维 数组 A,, ,下面 推导 任何 元 素 的 下 标 地 址 计算 公式 ,不 论 是 行 优 
先 还 是 列 优先 ,存储 一 个 数据 元 素 的 前 提 是 必须 把 它 前 面 应 该 存储 的 所 有 数据 都 存储 完毕 ， 
对 行 优先 来 说 就 是 该 元 素 上 面 的 所 有 行 必须 处 理 完 , 然 后 把 本 行 中 该 元 素 左边 的 所 有 元 素 
先 存储 完 。 列 优先 思路 类 似 。 
下 面 利 用 面积 公式 作为 推导 地 址 公式 的 一 个 模型 ,这样 可 以 比较 简单 地 了 解 地 址 计算 
公式 的 推导 过 程 。 
设 m 行 n 列 的 二 维 数组 As。 的 下 标 地 址 从 1 开始 。 以 行 优先 存储 法 为 例 , 和 矩形 的 面 
积 = 长 X 高 ,任何 一 个 元 素 am 要 存储 ,必须 先 处 理 两 个 矩形 。 第 一 个 矩形 由 上 面 的 所 有 行 
组 成 。 这 个 矩形 的 长 为 原 二 维 数组 的 列 数 n, 高 为 i 一 1。 第 二 个 矩形 由 这 个 数据 同一 行 左 
边 的 所 有 数据 组 成 ,所 以 长 为 j 一 1, 而 高 只 有 一 行 。 如 果 第 一 个 数据 的 实际 存储 地 址 发 生 了 
移动 ,那么 其 他 所 有 数据 都 会 跟着 移动 ,所 以 基准 是 第 一 个 数据 的 存放 地 址 ,从 更 加 通用 的 
一 一 角度 看 ,这 里 不 设置 为 0 或 1, 而 写成 Loc(an)。 如 


1 n 


Au 1!、 果 每 一 个 元 素 实 际 占用 单元 数 不 止 一 个 的 话 ,对 任 
1 人 何 元 素 的 存储 地 址 也 是 有 影响 的 ,所 以 从 通用 的 角 
|” 以” 度 考虑 ,约定 一 个 数据 占用 个 存储 单元 ,当然 ,KK 
1 在 绝 大 多 数 情况 下 就 是 1。 
7-3 ”利用 面积 公式 推导 二 维 数 图 7-3 为 利用 面积 公式 推导 二 维 数 组 地 址 计算 
组 地 址 计算 公式 示意 图 公式 的 过 程 。 


行 优先 存储 法 地 址 公式 计算 方法 : 设 数组 的 基 址 为 LOC(a ) ,每 个 数组 元 素 占据 K 个 
地 址 单元 ,任何 元 素 a 的 物理 地 址 为 : 
LOC(as)=LOC(C(a) + (Gi—1)*ntj—1)*K 
在 C++ 语言 程序 设计 中 ,由 于 数组 中 每 一 维 的 下 界 固定 为 0, 所 以 地 址 公式 相应 变 为 : 
LOC(ai) 一 LOCCao ) 十 (ix n 十 j) *K 
注意 : 此 处 下 标 改 为 从 0 开始 , 少 了 两 次 减法 计算 的 时 间 , 也 体现 了 高 级 语言 中 数组 下 
标 从 0 开始 的 好 处 。 在 内 存 中 ,数据 的 写 入 既 可 以 从 低地 址 到 高 地 址 ,也 可 以 反 过 来 ,从 高 
地 址 到 低地 址 。 如 果 是 递减 而 不 是 递增 ,那么 公式 中 两 部 分 之 间 的 加 号 就 应 该 变 成 减 号 。 
LOC(ai) 一 LOCCao ) 一 (ix n 十 j) *K 
请 读者 自己 完成 列 优先 下 任何 数据 的 地 址 计算 公式 推导 。 


7.4 特殊 矩阵 的 压缩 存储 


线性 代数 中 的 矩阵 在 程序 设计 时 就 是 用 二 维 数组 实现 的 。 如 ,图 形 的 变换 ,包括 放大 、 
缩小 .旋转 、 截 取 部 分 、 合 并 图 形 、 释 加 图 形 、 移 位 等 操作 ,从 本 质 上 说 就 是 在 不 断 地 进行 矩阵 
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运算 ,那么 这 些 操作 在 程序 设计 时 就 全 部 是 二 维 数组 实现 其 功能 了 ,所 以 本 章 使 用 矩阵 来 代 
表 二 维 数组 。 许 多 现实 应 用 会 导致 有 特殊 性 质 的 矩阵 ,如 三 角 和 矩阵 .对称 和 矩阵 、 带 状 矩 阵 等 ， 
如 果 数 据 全 部 存储 则 比较 浪费 空间 ,因为 有 很 多 数据 是 重复 的 。“ 数 据 结构 ”课程 大 部 分 都 
是 讨论 如 何 利 用 数据 结构 来 提高 程序 的 时 间 效 率 , 也 就 是 让 程序 运行 更 快 ,有 时 其 至 不 惜 牺 
牲 空间 的 代价 。 本 节 专 门 讨论 提高 存储 空间 效率 ,也 体现 了 数据 结构 的 另外 一 种 应 用 。 

对 称 和 矩阵 的 特点 为 : 在 一 个 n 阶 方 阵 中 ,有 ai 二 ai, 其 中 1<i<n ,1<j<n, 由 于 对 称 
和 矩阵 中 的 元 素 相 对 主 对 角 线 对 称 , 因 此 只 需 存储 其 上 三 角 或 下 三 角 部 分 。 如 果 存 储 下 三 角 
中 的 元 素 mi ,其 特点 是 j<i 且 1<i<n, 对 于 上 三 角 中 的 元 素 ai ,由 于 它 和 对 称 的 ai 相等 , 因 
此 当 访 问 的 元 素 在 上 三 角 时 ,把 行 下 标 与 列 下 标 交换 ,访问 和 它 对 称 的 下 三 角 元 素 即 可 。 全 
部 元 素 存储 需要 mw 个 存储 单元 .而 现在 只 需要 n(n 十 1)/2 个 存储 单元 ,节省 了 n(n 一 1)/2 
个 存储 单元 , 当 n 较 大 时 节省 了 可 观 的 存储 资源 。 

图 7-4 为 一 个 普通 矩阵 和 一 个 对 称 和 矩阵 的 对 比 。 

从 面积 公式 的 角度 看 ,下 三 角 是 一 个 梯形 ,因为 其 最 上 面 有 一 个 数据 , 故 下 面 的 公式 推 
导 过 程 中 ,启用 梯形 计算 公式 。 

对 下 三 角 的 数据 元 素 以 “ 行 优先 ”次 序 存 储 到 一 个 一 维 数组 中 去 ,下 三 角 中 共有 n(n 十 
1)/2 个 元 素 。 根 据 图 示 ,a; 前 面 的 数据 量 按 照 面积 计算 应 该 是 一 个 梯形 加 上 一 个 矩形 的 面 
积 , 图 7-5 为 对 称 和 矩阵 存储 地 址 计算 公式 示意 图 。 


9720 9324 。 
13461 并 过 汪汪 
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(a) 普通 矩阵 (b) 对 称 矩 阵 区 
图 7-4 普通 矩阵 和 对 称 矩 阵 对 比 示意 图 图 7-5 对称 矩阵 存储 地 址 计算 公式 示意 图 


设 au 的 存储 地 址 为 LOC(an) ,每 个 数据 元 素 占用 K 个 存储 地 址 , 则 数据 元 素 ai 的 地 
址 为 : 


LOC(Cai)=LOC(ad)D+((+0—D)* 0G—1D/2+0G—1))*K 
LOC(an ) 十 (ix (i—1)/2+j—1)*K 
与 对 称 和 矩阵 类 似 的 是 三 角 和 矩阵 , 它 的 特征 是 下 三 角 ( 或 上 三 角 ) 是 正常 的 矩阵 数据 ,其 他 
部 分 全 部 为 0 或 其 他 常数 。 
图 7-6 为 上 三 角 和 矩阵 和 下 三 角 和 矩阵 的 范例 ,三 角 和 矩阵 中 按照 主 对 角 线 分 开 , 其 中 一 边 的 
数据 为 某 个 常数 C。 它 的 压缩 存储 方案 与 对 称 和 矩阵 的 方案 一 样 ,只 不 过 读 取 数据 时 按照 上 
下 三 角 的 区 别 分 别处 理 即 可 ,读者 自行 判断 某 个 数 


9CCT 9324 

据 属于 哪 部 分 ,此 处 不 再 详细 讨论 。 c= 3 Te D= . : 

n 阶 和 矩阵 A 称 为 带 状 矩 阵 , 如 果 存 在 最 小 正 数 人 cececs 

m, 满 足 当 |i 一 j| 宇 m 时 ,ai 一 0, 这 时 称 w 一 2m 一 1 (a) 下 = 角 和 矩阵 (b) 上 三 角 和 矩阵 
为 矩阵 A 的 带宽 。 带 状 矩阵 也 称 为 对 角 和 矩阵 。 这 图 7-6 三 角 矩 阵 示意 图 


种 矩阵 中 所 有 非 零 元 素 都 集中 在 以 主 对 角 线 为 中 心 
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的 带 状 区 域 中 ,除了 主 对 角 线 和 它 的 左右 两 侧 若干 条 对 角 线 的 元 素 外 ,其 他 元 素 都 为 零 ( 或 
同一 个 常数 c) 。 

为 简化 起 见 , 此 处 讨论 带宽 为 3 的 带 状 和 矩阵 。 如 图 7-7 所 示 是 一 个 带宽 为 3 的 带 状 矩 
阵 范 例 和 面积 示意 图 。 从 面积 公式 的 角度 看 ,所 求 地址 的 数据 元 素 上 方形 状 是 一 个 “有 缺陷 
的 平行 四 边 形 ”, 如 果 补 上 左上 角 的 一 个 数据 元 素 ,每 行 的 非 零 元 素 个 数 是 一 样 的 ,所 以 上 面 
一 部 分 的 计算 公式 和 和 拢 形 的 是 一 样 的 。 而 对 于 该 数据 元 素 的 同一 行 前 面 的 数据 量 计 算 就 比 
较 麻烦 ,分 3 种 情况 ,分别 为 0、1、2 个 元 素 。 请 读者 自行 分 析 ai 属于 哪 种 情况 。 


E= 


n 
(a) 实际 带 状 矩 阵 (b) 地 址 公式 原理 
7-7 带 状 矩 阵 的 示意 图 


7.5 稀疏 矩阵 的 压缩 存储 


除了 上 面 讨论 过 的 特殊 矩阵 ,还 有 另外 一 种 特殊 矩阵 ,就 是 稀 朴 和 矩阵 ,其 特征 是 矩阵 中 
有 大 量 零 元 素 ,但 是 这 些 零 元 素 的 位 置 是 没有 规律 的 。 如 果 按 常 规 存 储 方法 将 全 部 零 都 存 
储 的 话 ,就 会 浪费 大 量 存储 空间 。 为 了 提高 存储 效率 ,这 里 希望 只 存储 非 零 元 素 , 但 是 还 需 
要 能 保证 其 他 非 零 元 素 的 正常 访问 。 

设 mxXxn 和 矩阵 中 有 d 个 非 零 元 素 且 dmXn, 这 样 的 矩阵 称 为 稀疏 矩阵 。 也 就 是 说 稀 
芍 和 矩阵 中 非 零 元 的 个 数 非常 少 ,一 般 认为 应 该 在 15% 其 至 10% 以 下 。 在 存储 数据 元 素 本 身 
之 外 同时 存储 其 位 置信 息 ,约定 记录 下 数据 元 素 所 在 行 和 列 下 标 ,也 就 是 将 非 零 元 素 所 在 的 
行 、 列 以 及 值 构成 一 个 三 元 组 (row,col,value) ,按照 行 优先 的 顺序 采用 顺序 存储 方法 存储 
三 元 组 , 称 为 三 元 组 表 。 

仅 存 储 非 零 元 素 和 相应 位 置 还 不 够 ,因为 不 知道 原来 矩阵 的 实际 大 小 ,这样 就 不 能 完整 
还 原 。 因 为 矩阵 中 容许 某 一 行 或 某 一 列 都 是 0, 如 果 最 大 行 或 最 大 列 上 全 部 为 0, 则 三 元 组 
中 行列 的 最 大 值 并 不 能 代表 原来 矩阵 的 大 小 。 为 了 正确 地 还 原 , 故 还 要 存储 该 矩阵 的 总 行 
数 和 总 列 值 。 为 了 编程 方便 ,再 存储 非 零 元 素 的 总 个 数 。 思 路 之 一 为 ,存储 这 些 信息 时 , 启 
用 三 个 变量 。 思 路 之 二 为 ,三 元 组 在 编程 时 采用 二 维 数组 ,下 标 从 0 开始 ,那么 可 以 把 总 行 、 
总 列 数 和 非 零 元 素 个 数 放 在 相应 二 维 数组 的 第 0 行 上 的 第 0 列 \ 第 1 列 和 第 2 列 ,第 一 个 真 
正 的 非 0 数据 从 行 下 标 1 开始 存放 。 

图 7-8 为 稀 玖 矩阵 和 对 应 的 三 元 组 压缩 存储 法 的 示意 图 。 

三 元 组 存储 法 要 求 在 稀 玻 矩阵 中 的 非 零 元 素 非常 稀少 时 才能 有 效 。 如 原来 的 非 零 元 素 
数据 占 40%, 则 用 三 元 组 存储 后 已 经 比 原来 二 维 数组 存储 法 还 要 占用 更 多 的 空间 。 

稀 玻 矩阵 的 运算 结果 也 不 一 定 还 是 稀 玻 矩阵。 如 稀 玻 抢 阵 的 加 法 ,如 果 大 量 非 零 元 素 
的 位 置 完全 不 同 ,位 置 互补 后 就 可 能 出 现 非 稀 玻 矩阵 。 这 些 因 素 在 编程 中 也 需要 考虑 。 


< 116 


第 7 章 二 维 数组 和 广义 表 的 构造 与 应 用 


(ok 
ee F of7 [7 Te: 
12345 | 上 = 
ee lo ils 

ol10300000 2 ls a 

1 由 0000040 2 1 5 
1 3 

2|10500000 5 

F-3l|0000160 ela 3 

4|10008002 7[4 [elz 

549000007 s[s |ole 

61\0000000 9L5|6|17 


图 7-8 稀疏 矩阵 和 对 应 的 三 元 组 压缩 存储 法 的 示意 图 


三 元 组 存储 法 节约 了 存储 空间 ,但 从 算法 设计 角度 观察 ,矩阵 的 各 种 运算 从 编程 上 会 变 
得 更 难 实现 。 

下 面 的 程序 源码 主要 用 于 把 稀 玻 矩阵 压缩 为 三 元 组 ,也 可 以 把 三 元 组 解压 缩 为 稀 玻 矩 
阵 。 数 据 的 输入 采用 了 人 工 输入 和 计算 机 自动 产生 两 种 。 特 别 是 计算 机 自动 产生 稀 玖 和 矩阵 
和 三 元 组 过 程 中 ,有 用 户 可 以 给 定数 组 大 小 的 灵活 性 ,有 关于 稀 玻 量 的 控制 \ 有 非 零 元 素 三 
元 组 数据 如 何 产生 的 技巧 \ 有 如 何 确保 三 元 组 行 优先 的 设计 等 。 全 面 研究 明白 后 对 于 二 维 
数组 程序 设计 会 有 一 个 比较 好 的 理解 。 由 于 篇 幅 所 限 ,从 文件 中 读 和 数据、 菜单 设计 、 主 函 
数 等 留 给 读者 自行 完成 。 

【程序 源码 7-1】 稀疏 和 矩阵 的 压缩 与 解压 缩 的 部 分 程序 源 代码 如 下 。 


# include < iostream.h> 

#include <windows.h> 

#include <conio.h> 

# include < iomanip.h> 

#include <time.h> 

#include < fstream.h> 

const max = 10; 

// 三 元 组 第 三 个 元 素 为 处 理 其 他 数据 类 型 做 准备 
typedef int datatype; 

// 三 元 组 对 象 设计 

class triples //triples: 三 元 组 


friend class sparsematrixdata; 


private: 

int datarow; //data: 数 据 , row: 行 

int datacol; //col: 列 

datatype dataval; //val: 值 
}; 
// 定 义 存储 文件 名 
ofstream matin(" 和 矩阵 压缩 前 原始 数据 .txt"); //mat:matrixdata: 和 矩阵 ,in: 输入 
of stream matout(" 和 矩阵 压缩 后 三 元 组 数据 .txt"); //mat:matrixdata: 和 矩阵 ,out: 输 出 
ofstream triin(" 三 元 组 原始 数据 .txt"); //tri:triples: 三 元 组 , in: 输入 
ofstream triout(" 三 元 组 解压 后 矩阵 数据 .txt"); //tri:triples: 三 元 组 ,out: 输 出 
// 稀 朴 矩 阵 对 象 设计 


class sparsematrixdata 
{ 


private: 
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int matrixdata[ max][max]; // 内 部 稀 朴 矩阵 的 定义 
// 约 定 三 元 组 个 数 为 稀 朴 矩阵 元 素 个 数 总 数 的 20% 以 下 加 上 第 一 行 的 总 行 总 列 , 可 能 没有 用 完 
// 此 空间 ,类 似 线性 表 
triples triplesdata[ max * max/5+ 1]; 
public: 
sparsematrixdata( ){} 
~sparsematrixdata( ){} 
// 压 缩 函 数 
void matinput(int row, int col); // 手 工 输入 稀疏 矩阵 
void matcreat (int row, int col); // 自 动产 生 稀 朴 矩阵 
void transpose( int row, int col); // 压 缩 稀 朴 矩 阵 成 为 三 元 组 
// 解 压缩 函数 
void triinput(int row, int wide, int length); // 手 工 输入 三 元 组 
void tricreat(int row); // 自 动产 生 三 元 组 
bool testequal (int point, int * data); // 去 掉 重复 数据 
void simpleselectsorting(int k, int * data); // 排 序 使 分 割 后 的 行列 信息 符合 行 优先 
void retranspose( int row); // 解 压 三 元 组 成 为 稀 朴 矩阵 
}; 
// 对 象 函 数 的 实现 
void sparsematrixdata: :matinput( int row, int col) 
{ 
int i,j; 
int number; // 非 零 元 素数 目 , 随 机 产生 
int count = 0; // 计 数 , 非 零 元 素 个 数 
int judge = 0; // 判 定 非 零 元 素数 目 是 否 超出 


cout <<" 这 是 "<< row <<" 行 "<< col <<" 列 的 矩阵 范例 : "<< endl; 


for(i=0;i<row;it+) 


‘ 
for(j=0;j<col;j++) 
cout << rand() % 10 << setw(6); 
cout << endl; 
do 


{ 
cout <<" 请 输入 稀 朴 矩阵 中 非 零 元 素 个 数 : (约定 不 超过 总 数 的 "<< 2 * max <<"%, 即 <= "<< 
row # col * max/50 <<")"<< endl; 
cin >> number; 
}while(number >(row * col * max/50)); // 默 认 个 数 为 总 数 的 20% 以 下 
cout <<" 请 输入 "<< row <<" 行 "<< col <<" 列 的 矩阵 : "<< endl; 
for(i=0;i<row;it+) 
for(j=0;j<col;j++) 
cin>> matrixdata[ i][j]; 
for(i=0;i<row;it+) 
for(j=0;j<col;j++) 
{ 
if(matrixdata[ i][j]!= 0) 
Count++; 
if(count > number) 
// 如 果 超 出 个 数 ,后 面 的 数据 都 自动 归 零 
{ 
judge= 1; 
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matrixdata[i][j] = 0; 
} 
} 
if(judge) 
cout << endl <<" 多 余 非 零 元 素数 据 已 重 置 !"<< endl << endl; 
cout <<" 这 是 您 输入 的 稀 朴 矩阵 :"<< endl; 
for(i=0;i<row;it+) 
{ 
for(j=0;j<col;j++) 
人 
cout << matrixdata[ i][j]<< setw(6); 
matin << matrixdata[ i][j]<< setw(6); 
// 存 人 文件 
cout << endl; 
matin << endl; 
cout << endl; 
matin. close( ); 
} 
void sparsematrixdata: :matcreat( int row, int col) 
{ 
int i,j; 
int dataij[max * max/5]; 
int count; 
int rowc, colc; 
do 
{ 
count = rand() % (row* col/5); 
// 确 定 稀 朴 矩阵 非 零 元 素 个 数 
}while (count <(row* col/5 — 3)); 
// 设 法 使 得 稀疏 数据 量 接近 总 量 的 20 % 
// 避 免 数 据 量 过 少 
for(i=0;i<row;it+) 
for(j=0;j<col;j++) 


matrixdata[ i][j] = 0; // 赋 初 值 

for(i= 0;i< count;i++) // 利 用 技巧 解决 了 非 零 元 素 分 布 的 均匀 性 
{ 

dataij[i] = rand() % 100; // 先 产生 一 个 两 位 数 ,首位 可 以 为 0 

rowc = dataij[i]/10; // 十 位 数 约定 给 行 下 标 

colc =dataij[i] $10; // 个 位 数 约定 给 列 下 标 

do 

{ 


matrixdata[ rowc][colc] = rand() % 100; 
// 把 这 个 位 置 控 制 住 
// 再 产生 一 个 一 位 数 的 随机 数 存 人 
}while(matrixdata[ rowc][colc]< 10); 
} 
cout <<" 这 是 产生 的 稀 朴 矩阵 : "<< endl1; 
for(i=0;i<row;it+) 


{ 
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for(j=0;j< col;j++) 
{ 
cout << setw(6)<< matrixdata[ i][j]; 
matin << setw(6)<< matrixdata[ i][j]; 
// 存 入 文件 
} 
cout << endl; 
matin << endl; 
上 
cout << endl; 
matin. close( ); 
} 
void sparsematrixdata: :transpose( int row, int col) 
{ 
int i,j; /三 代表 行 ,j 代表 列 
int count = 0; // 计 数 
for(i=0;i<row;it+) 
for(j=0;j<col;j++) 
if(matrixdata[i][j]!= 0) 
{ 
triplesdata[ count + 1]. datarow = i; // 记 录 非 零 元 素 的 行 
triplesdata[ count + 1]. datacol = j; // 记 录 非 零 元 素 的 列 
triplesdata[ count + 1]. dataval = matrixdata[ i][j]; 
// 记 录 非 零 元素 的 值 , 三 元 到 位 
Count++; 
} 
// 以 下 为 三 元 组 第 一 行 中 存储 的 总 行 数 、 总 列 数 、 非 零 元素 个 数 
triplesdata[ 0]. datarow = row; 
triplesdata[0]. datacol = col; 
triplesdata[ 0]. dataval = count; 
cout <<" 这 是 三 元 组 的 形式 :"<< endl; 
cout <<" 行 "<< setw(6)<<" 列 "<< setw(6)<<" 值 "<< setw(6)<< endl; 
for(i=0;i<= count;i++) 
{ 
cout << triplesdata [i]. datarow << setw (6)<< triplesdata[i]. datacol << setw (6)<< 
triplesdata[ i]. dataval << setw(6)<< endl; 
matout << triplesdata [i]. datarow << setw(6)<< triplesdata[i]. datacol << setw(6)<< 
triplesdata[ i]. dataval << setw(6)<< endl; // 存 人 文件 
} 
cout << endl; 
matout. close( ); 
Y 
void sparsematrixdata: :triinput( int row, int wide, int length) 
‘ 
cout <<" 请 输入 "<< row <<" 行 的 三 元 组 :"<< endl; 
for(int i=1;i<= row;it+) 
{ 
do 
{ 
cout <<" 请 输入 第 "<< i <<" 行 数据 :"; 
cin >> triplesdata[ i]. datarow >> triplesdata[ i]. datacol >> triplesdata[ i]. 
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} while (triplesdata [i]. datarow > = wide | | triplesdata[ i]. datacol > = length| | 
triplesdata[ i]. dataval == 0); 


} 


// 以 下 为 三 元 组 第 一 行 中 存储 的 总 行 数 、 总 列 数 、 非 零 元素 个 数 


triplesdata[ 0]. datarow = wide; 

triplesdata[ 0]. datacol = length; 

triplesdata[ 0]. dataval = row; 

// 行 排序 

for(int term= 1;term<= row;term++) 
for(i=1;i<= term;i++) 


if(triplesdata[ i]. datarow> triplesdata[ term]. datarow) 


{ 
triples iterm = triplesdata[ term]; 
for(int j= term;j>i;j——) 


// 保 留 未 排 数据 首位 置 的 值 
// 移 动 数据 


triplesdata[j] = triplesdata[j—1]; 


triplesdata[ i] = iterm; 
break; 
} 
cout << endl <<" 这 是 您 输入 的 三 元 组 : "<< endl; 


for(i=1;i<= row;it+) 


// 把 数据 存 人 


cout << triplesdata[ i]. datarow << setw(6)<< triplesdata[ i]. datacol << setw(6)<< 
triplesdata[ i]. dataval << setw(6)<< endl; 


cout << endl; 


void sparsematrixdata: :tricreat( int row) 


{ 


int dataij[max]; 
for(int k=1;k<= row;k+t+) 
// 这 里 从 1 开始 ,下 面 再 考虑 0 行 的 3 个 数据 
{ 
do 
{ 
dataij[k] = (rand() % 100); 
// 产 生 0 一 99 的 数据 
}while(testequal(k, dataij)); 
// 只 要 检测 的 结果 为 真 就 重新 产生 数据 
} 
for(k=2;k<= row;kt+) 
simpleselectsorting(row, dataij); 
/* 分 离 数据 ,得 到 行列 */ 


for(k=1;k<= row;k+t+) 


{ 
triplesdata[k]. datarow = dataij[k]/10; 
triplesdata[k]. datacol = dataij[k] % 10; 
do 
{ 
triplesdata[k]. dataval = (rand() % 100); 
}while(triplesdata[k]. dataval < 10); 
} 
// 求 总 列 数 


// 十 位 数 为 行 值 
// 个 位 数 为 列 值 


// 第 三 列 放 2 位 数 的 数据 
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int datacmax = triplesdata[1]. datacol; 
for(int i=2;i<= row;it+) 

if(datacmax < triplesdata[ i]. datacol) 

datacmax = triplesdata[ i]. datacol; 

// 以 下 为 三 元 组 第 一 行 中 存储 的 总 行 数 、 总 列 数 、 非 零 元素 个 数 
triplesdata[ 0]. datarow = dataij[row]/10+1; 
triplesdata[ 0]. datacol = datacmax + 1; 
triplesdata[ 0]. dataval = row; 


cout << endl; 


bool sparsematrixdata: :testequal( int point, int * data) // 判 断 是 否 是 重复 数据 


{ 


) 


for(int i=1;i<point;it+) 
if(data[ point] == data[i]) 
return 1; 


/1/1 代表 出 现 了 相等 的 情况 
/10 代表 没有 相等 的 情况 


return 0; 


void sparsematrixdata: :simpleselectsorting(int k, int * data) 


{ 


} 


int min; 
for(int term= 1;term<=k;termt+) 
for(int i= term+1;i<=k;i++) 
if(data[i]< data[ term]) 
{ 
min= data[ i]; 
data[ i] = data[ term]; 
data[ term] = min; 
} 


void sparsematrixdata: :retranspose( int row){ 


/人 /代表 行 ,j 代表 交换 中 的 行 
// 最 大 行 ,最 大 列 


inkt 所 

int maxrow, maxcol; 

int rowc, colc; 

cout <<" 这 是 行 优先 三 元 组 的 形式 :"<< endl; 
cout <<" 行 "<< setw(6)<<" 列 "<< setw(6)<<" 值 "<< setw(6)<< endl; 

for(i=0;i<= row;it+) 

{ 

cout << triplesdata[ i]. datarow << setw(6)<< triplesdata [i]. datacol << setw (6)<< 


triplesdata[ i]. dataval << setw(6)<< endl; 


triin << triplesdata[ i]. datarow << setw(6)<< triplesdata[i]. datacol << setw (6)<< 


triplesdata[ i]. dataval << setw(6)<< endl; // 存 入 文件 
} 
maxrow = triplesdata[ 0]. datarow; // 最 大 行 
maxcol = triplesdata[ 0]. datacol; // 最 大 列 
for(i=0;i<maxrow;it+) // 先 行 把 所 有 数据 预 置 为 0 


for(j=0;j<maxcol;j++) 
matrixdata[i][j] = 0; 
for(i=1;i<= row;it++) 
{ 
rowc = triplesdata[ i]. datarow; 
colc = triplesdata[i]. datacol; 


// 把 三 元 组 信息 恢复 到 稀 玖 和 矩阵 中 去 


// 等 号 对 齐 有 利于 看 清楚 功能 
// 恢 复 行 和 列 的 值 
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matrixdata[ rowc][colc] = triplesdata[ i]. dataval; // 再 恢复 稀疏 矩阵 中 元 素 的 值 
} 
cout << endl <<" 解 压缩 后 总 行 :"<< maxrow <<", 总 列 :"<< maxcol <<", 非 零 元 个 数 : "<< row << 
endl; 
cout <<" 这 是 解压 后 稀 朴 矩阵 的 数据 :"<< endl; 
for(i=0;i<maxrow;it+) 
{ 
for(j= 0;j< maxcol;j++) 
{ 
cout << setw(6)<< matrixdata[ i][j]; 
triout << setw(6)<< matrixdata[ i][j]; // 存 人 文件 
} 
triout << endl; 
cout << endl; 
} 
cout << endl; 
triin. close(); 
triout. close( ); 


} 
图 7-9 为 稀 疏 和 矩阵 的 压缩 和 解压 缩 程 序 运行 图 。 
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图 7-9 稀 朴 矩阵 的 压缩 和 解压 缩 程 序 运行 图 


下 面 深 入 讨论 矩阵 的 转 置 运算 ,会 发 现 三 元 组 的 程序 设计 比 起 常规 的 二 维 数组 的 程序 
设计 要 困难 得 多 。 

在 常规 二 维 数 组 存储 的 稀 朴 矩阵 下 ,编程 进行 转 置 是 通过 一 个 双重 循环 直接 完成 的 。 
到 了 三 元 组 存储 时 会 发 生 什么 情况 呢 ? 设 Fl 表示 一 个 mXn 稀疏 矩阵 的 三 元 组 结构 ,其 转 
置 F2 则 对 应 一 个 nXm 的 稀疏 矩阵 的 三 元 组 结构 。 由 于 三 元 组 中 头 两 列 正好 是 行 的 信息 
和 列 的 信息 , 故 有 的 读者 认为 ,编制 一 个 循环 ,把 这 两 列 的 数据 进行 左右 交换 即 可 。 这 样 的 
过 程 显然 更 加 简单 ,从 数学 角度 也 可 以 认为 是 正确 的 ,但 是 从 计算 机 程序 设计 的 角度 看 就 有 
问题 了 。 因 为 Fl 是 按照 行 优先 的 次 序 排放 数据 的 ,所 有 第 一 列 的 数据 必然 是 有 序 的 。 而 仅仅 
做 一 个 交换 ,原来 第 二 列 的 数据 并 没有 排序 的 情况 下 移动 到 第 一 列 后 就 破坏 了 行 优先 规则 。 

如 何 解 决 这 个 问题 呢 ? 有 些 读 者 又 设想 用 排序 的 方式 来 解决 ,这 实际 上 也 是 不 对 的 , 因 
为 数据 有 重复 ,即使 排序 后 ,也 不 能 保证 相同 数据 对 应 的 列 信息 是 排序 的 效果 。 如 果 启 动 二 
次 排序 ,把 行 信息 中 相同 数据 的 对 应 列 信息 单独 再 进行 排序 ,那么 从 原理 上 就 必须 对 每 个 不 
同 的 数据 都 要 处 理 , 由 于 每 个 不 同 的 数据 量 也 不 能 事先 控制 ,所 以 这 种 程序 设计 思路 即使 是 
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功能 正常 ,也 是 不 可 取 的 。 

下 面 是 第 一 种 解决 方案 , 称 为 逐 行 扫描 转换 法 。 既 然 转 置 后 的 效果 需要 符合 行 优先 , 那 
么 就 从 Fl 的 列 信 息 中 依次 扫描 ,如 第 一 轮 扫 描 数据 0, 遇 到 0 的 数据 则 从 上 到 下 逐一 存储 
到 F2 从 小 到 大 的 空间 中 ,直到 所 有 行 处 理 完 毕 。 第 二 轮 再 处 理 1 下 标的 数据 ,相同 的 思路 
一 直 循 环 处 理 完 最 大 值 。 编 程 时 将 启用 双重 循环 ,第 一 重 循环 处 理 所 有 行 数据 , 第 二 重 循环 
处 理 每 个 行 数 据 对 应 的 所 有 列 数据 。 


F012 E012 如 果 有 多 个 行 数据 相同 的 话 , 直 接 逐 一 传输 过 去 
of7 [719 号 二 7 [9 对 不 对 呢 ? 图 7-10 为 一 个 稀 朴 矩阵 对 应 的 三 元 组 进 
二 生生 -~ 有 |， 行 转 置 的 示意 图 。 原 三 元 组 行 优先 时 确定 值 对 应 的 
时 可 7 上 1 和 4。 列 信息 也 是 从 小 到 大 排列 的 ,所 以 在 转 置 后 正好 吻合 
5 3 5 8 4|311415 行 优先 。 为 了 示意 图 的 清晰 性 ,这 里 只 标注 了 0 和 1 
42/O 上 和。 的 扫描 过 程 ,一 共 只 有 3 次 转换 ,其 他 请 读者 自行 
8| 5 0 19 6 412 18 完成 。 

9| 5 6 | 7 6 5 |7 |9 


设 mn 是 原 和 矩阵 的 行列 ,vcount 是 稀 玻 矩阵 的 
图 7-10 各 玻 矩 阵 三 元 组 转 置 。。 非 零 元 素 个 数 ,分 析 本 算法 ,时 间 主 要 耗费 在 col 和 
故国 pcount 的 二 重 循环 上 ,所 以 时 间 复 杂 度 为 O(n X 
vcount) ,如 果 非 零 元 素 的 个 数 vcount 上 升 到 与 mXn 同 数量 级 时 ,算法 的 时 间 复 杂 度 将 变 
为 OC(mXm), 与 通常 存储 方式 下 的 矩阵 转 置 算法 相 比 ,提高 了 存储 效率 ,但 时 间 效 率 更 差 
一 些 。 这 就 是 时 空转 换 的 典型 特征 。 
下 面 是 第 二 种 解决 方案 , 称 为 计算 个 数 转换 法 。 上 述 算 法 时 间 效 率 低下 的 原因 是 要 在 
三 元 组 表 上 反复 扫描 Fl 表 , 若 能 直接 确定 Fl 中 每 一 个 三 元 组 在 F2 中 的 位 置 , 则 对 Fl 三 
元 组 表 扫 描 一 次 即 可 。 
这 是 可 以 做 到 的 ,因为 Fl 中 第 一 列 的 第 一 个 非 零 元 素 一 定 存储 在 F2 的 第 一 个 位 置 
上 ,如果 还 知道 第 一 列 的 非 零 元 素 的 个 数 ,那么 第 二 列 的 第 一 个 非 零 元 素 在 F2 中 的 位 置 便 等 
于 第 一 列 的 第 一 个 非 零 元 素 在 F2 中 的 位 置 加 上 第 一 列 的 非 零 元 素 的 个 数 ,如 此 类 推 , 因 为 Fl 
中 三 元 组 的 存放 顺序 是 行 优先 ,对 同一 行 来 说 ,必定 先 遇 到 列 号 小 的 元 素 ,这 样 只 需 扫 描 一 
遍 Fl 即 可 。 根 据 这 个 想法 ,引入 两 个 向 量 来 实现 : num[n 十 1] 和 cpotLn 十 1],num[col] 表 
示 和 矩阵 Fl 中 第 col 列 的 非 零 元 素 的 个 数 ( 为 了 方便 从 1 单元 开始 存储 ) ,cpotLcol] 初 始 值 表 
示 和 矩阵 Fl 中 的 第 col 列 的 第 一 个 非 零 元 素 在 F2 中 的 位 置 。 
cpot 的 初始 值 为 : cpot[1] = 1; col=1 
cpot[col] = cpot[col -1] +num[col—1]; 2<col<n 
依次 扫描 Fl1, 当 扫描 到 一 个 col 列 元 素 时 ,直接 将 其 存放 在 F2 的 cpot[col] 位 置 上 ， 
cpot[col] 加 1,cpotLcolj 中 始终 是 下 一 个 col 列 元 素 在 F2 中 的 位 置 。 


7.6 稀疏 矩阵 的 十 字 链 表 存 储 


三 元 组 可 以 理解 为 稀 下 和 矩阵 的 一 种 顺序 存储 结构 。 因 为 稀 朴 窍 阵 的 数据 不 一 定 是 整 
数 , 可 能 还 有 小 数 、 字 符 等 情况 ,所 以 设计 成 结构 体 三 元 组 组 成 的 一 维 数组 比较 合理 ,也 同时 
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考虑 了 数据 量 压缩 的 问题 ,但 是 在 做 一 些 操 作 ( 如 和 矩阵 加 法 、 乘 法 ) 时 , 非 零 项 数目 会 发 生 增 
加 或 减少 , 非 零 元 素 的 位 置 会 需要 移动 ,此 时 这 种 表示 方法 就 显得 不 理想 ,因为 顺序 存储 时 
数据 移动 使 得 时 间 效 率 下 降 。 

本 节 将 介绍 稀 玻 矩阵 的 一 种 链接 存储 结构 一 一 十 字 链 表 , 它 具备 了 链接 存储 的 优点 , 结 
点 在 新 增 的 时 候 临时 申请 ,在 不 需要 的 时 候 通 过 释放 空间 可 以 更 充分 地 利用 存储 空间 。 

对 每 个 非 零 元 素 存 储 为 一 个 结 点 , 结 点 由 5 个 域 组 成 ,其 结构 如 图 7-11 所 示 。 其 中 : 
row 域 存储 非 零 元 素 的 行 号 ; col 域 存储 非 零 元 素 的 列 号 ; value 域 存储 本 元 素 的 值 ; right 
是 指针 域 ,指向 横向 关系 的 直接 后 继 ; down 也 是 个 指针 域 ,指向 纵向 关系 的 直接 后 继 。 


row | col value 
01234556. right 
010300000 
1 中 0 0 0 0/0 4N4 国 国 FE 
2|050000)0 天 到 value/next 
F=3| 0 0 0 0N 6/0 
外 "00080902 ED] Eel] 
OD Od Od 00 LIL 
(a) 稀 下 和 矩阵 (b) 基本 结 点 形式 和 范例 (0) 变形 结 点 形式 


图 7-11 稀疏 矩阵 的 十 字 链 表 表 示 法 示意 图 


图 7-11 是 一 个 稀 玻 矩阵 的 十 字 链 表 表 示 法 。 限 于 版 面 , 只 给 出 其 中 3 个 数据 之 间 的 十 
字 链 表 表示 , 原 稀 玻 矩阵 的 这 3 个 数据 用 圆圈 标注 。 

稀 玻 矩阵 中 每 一 行 的 非 零 元 素 结 点 , 按 其 列 号 从 小 到 大 的 顺序 由 right 域 链 成 一 个 带 
表 头 结 点 的 循环 行 链表 ,同样 每 一 列 中 的 非 零 元 素 按 其 行 号 从 小 到 大 的 顺序 由 down 域 链 
成 一 个 带 表 头 结 点 的 循环 列 链表 。 即 每 个 非 零 元 素 am 既是 第 i 行 循环 链表 中 的 一 个 结 点 ， 
又 是 第 j 列 循环 链表 中 的 一 个 结 点 。 如 果 某 种 应 用 需要 访问 横向 的 直接 前 趋 或 纵向 的 直接 
前 趋 结 点 ,那么 上 述 设 计 依然 不 大 方便 。 于 是 可 以 再 次 增加 链 域 ,启用 4 个 方向 的 指针 ,分 
别 为 left\right\up .down。 

由 于 每 一 行 的 链表 和 每 一 列 的 链表 入 口 较 多 ,所 以 决定 启用 一 批 头 结 点 数组 作为 统一 
管理 的 入 口 , 它 的 结 点 形式 与 数据 的 结 点 形式 基本 一 致 , 行 链表 、 列 链表 的 头 结 点 的 row 域 
和 col 域 置 0。 每 一 列 链 表 的 表 头 结 点 的 down 域 指向 该 列 链表 的 第 一 个 元 素 结 点 ,每 一 行 
链表 的 表 头 结 点 的 right 域 指向 该 行 表 的 第 一 个 元 素 结 点 。 

由 于 各 行 、 列 链表 头 结 点 的 row 域 .col 域 和 value 域 均 为 零 . 行 链表 头 结 点 只 用 right 
指针 域 , 列 链表 头 结 点 也 只 用 right 指针 域 , 故 这 两 组 表 头 结 点 可 以 合用 。 也 就 是 说 ,对 于 
第 i 行 的 链表 和 第 i 列 的 链表 可 以 共用 同一 个 头 结 点 。 但 是 如 果 该 矩阵 不 是 方 阵 ,那么 就 要 
选取 其 中 更 大 的 值 来 作为 头 结 点 的 数目 。 

为 了 方便 地 找到 每 一 行 或 每 一 列 , 可 以 将 每 行 ( 列 ) 的 这 些 头 结 点 链接 起 来 ,因为 头 结 点 
的 值 域 目前 空闲 ,所 以 决定 启用 头 结 点 的 值 域 作为 链接 各 头 结 点 的 链 域 , 即 第 i 行 ( 列 ) 的 头 
结 点 的 值 域 指向 第 i 十 1 行 ( 列 ) 的 头 结 点 .……… ,形成 一 个 循环 表 。 因 为 非 零 元 素 结 点 的 值 
域 是 datatype 类 型 ,而 在 表 头 结 点 中 的 值 域 需要 改 为 指针 类 型 ,为 了 使 整个 结构 的 结 点 一 
致 ,约定 表 头 结 点 和 其 他 结 点 有 同样 的 结构 ,因此 该 域 可 以 用 一 个 C 语言 中 的 联合 体 结构 
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来 表示 。 

为 了 避免 空 表 带 来 的 麻烦 ,给 这 个 循环 链表 再 启用 一 个 头 结 点 ,这 就 是 最 后 的 总 头 结 
点 。 总 头 结 点 的 row 和 col 域 存储 原 和 矩阵 的 行 数 和 列 数 。 

十 字 链 表 充 分 体现 了 链表 中 结 点 申请 和 空间 释放 的 自由 性 及 删除 插入 等 操作 的 时 间 效 
率 较 高 的 良好 特性 ,但 是 在 空间 利用 率 上 将 会 付出 较 大 代价 。 假 设 把 数据 占用 空间 和 链表 
结 点 空间 视 为 一 致 ,那么 三 元 组 就 是 通过 扩大 3 倍 的 方式 进行 存储 ,十 字 链 表 就 更 加 占用 空 
间 ,竟然 到 了 扩大 5 倍 或 7 倍 的 程度 。 为 了 维护 这 些 结 点 之 间 的 正确 链接 ,也 需要 付出 一 定 
的 时 间 成 本 。 


7.7 二 维 数组 的 应 用 案例 与 程序 设计 


【应 用 案例 7-1】 二 维 数组 主要 用 来 表示 横向 和 纵向 两 个 方向 的 数据 关系 ,但 在 现实 
问题 中 还 会 遇 到 更 复杂 的 数据 关系 。 如 在 五 子 棋 的 程序 设计 中 就 必须 考虑 斜 向 45° 的 关 
系 , 在 象棋 的 程序 设计 中 * 马 ?的 “日 ? 形 走 法 ,或 者 虽然 是 45 的 关系 ,但 是 直接 距离 更 远 , 如 
象棋 程序 设计 中 “ 象 ”的 走 法 。 

【应 用 案例 7-2】 迷宫 经 典 问题 的 求解 。 用 计算 机 编程 模拟 一 个 迷宫 ,其 中 设置 有 很 
多 墙壁 和 一 些 通道 ,墙壁 对 前 进 方向 形成 了 多 处 障碍 ,设计 一 个 老鼠 在 迷宫 中 寻找 出 口 。 由 
于 本 程序 设计 的 思路 是 试探 找 路 ,所 以 通常 会 使 用 回溯 法 ,这 是 一 种 不 断 试探 且 及 时 纠正 错 
误 的 搜索 方法 。 

下 面 是 搜索 过 程 。 从 入 口 出 发 , 按 某 一 方向 向 前 探索 ,车 能 往 前 走 ( 即 前 面 的 点 未 走 
过 ), 即 某 处 可 以 到 达 , 则 到 达 一 个 新 的 点 ,否则 试探 下 一 方向 ; 若 所 有 的 方向 均 没 有 通路 ， 
则 沿 原 路 返回 上 一 个 点 ,更 换 下 一 个 方向 再 继续 试探 ,直到 所 有 可 能 的 通路 都 探索 到 。 如 果 
其 中 正好 碰 到 了 出 口 , 则 任务 完成 ; 如 果 返 回 入 口 点 而 所 有 方向 都 已 经 试探 完毕 , 则 任务 失 
败 , 表 示 没 有 出 口 。 

为 方便 编程 ,方向 必须 确定 下 来 ,此 处 约定 进口 在 左上 方 ,出 口 在 右 下 方 ,所 以 约定 从 横 
向 开始 , 顺 时 针 转 动 方向 ,一 共 8 种 。 

在 求解 过 程 中 ,为 了 保证 在 到 达 某 一 点 后 不 能 向 前 继续 行走 (无 路 ) 时 ,能 正确 返回 上 一 
个 点 以 便 继续 从 下 一 个 方向 向 前 试探 ,需要 启用 一 个 栈 保存 能 够 到 达 的 每 一 点 的 下 标 以 及 
从 该 点 前 进 的 方向 。 在 求解 这 个 难题 时 ,需要 解决 4 个 设计 问题 ,下 面 分 别 讨论 。 

第 一 个 问题 是 如 何 用 数据 结构 表示 迷宫 。 设 迷宫 为 m 行 n 列 ,利用 二 维 数组 maze[mj[n] 


来 表示 一 个 迷宫 ,maze[ 让 [j] =0 或 1。 其 中 : 0 表示 通路 ,1 表示 不 通 , 当 从 某 点 向 下 试探 
0 123456789 时 ,中 间 点 有 8 个 方向 可 以 试探 ,而 4 个 角 点 有 3 个 方向 ,其 
of a 1 他 边缘 点 有 5 个 方向 。 为 使 问题 简化 , 改 用 二 维 数组 maze 
2 上 上 上 | [Cm 二 2JCn 十 2] 表示 迷宫 ,迷宫 四 周 的 值 全 为 1, 相当 于 在 迷 
3|1lolmolo4ololol1l1| 宫 外 面 包 右 了 一 面 墙 。 这 样 使 问题 变 得 简单 ,因为 每 个 点 的 
半生 革 试探 方向 全 部 为 8, 不 用 再 判断 当前 点 是 边界 ,四角 还 是 

6l1lolililololilifoj1| 中 间 。 
"nh 图 7-12 为 一 个 6X8 的 迷宫 范例 ,矩阵 大 小 设计 为 8X 
图 7-12 迷宫 范例 的 示意 图 “10, 下 标 分 别 为 0 一 7 和 0 一 9。 入 口 坐 标 为 (1,1) ,出口 坐标 
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为 (6,8) ,虚线 为 其 中 一 条 可 以 成 功 出 来 的 通路 。 


迷宫 的 定义 如 下 : 
#define m6 // 迷 宫 的 实际 行 
#definen8 // 迷 宫 的 实际 列 


int maze [m+2][n+2]; 


第 二 个 问题 是 试探 方向 如 何 解 决 。 在 上 述 表 示 迷 宫 的 情况 下 ,每 个 点 有 8 个 方向 供 试 
探 , 如 当前 点 的 坐标 (x,y) ,与 其 相 邻 的 8 个 点 的 坐标 都 可 根据 与 该 点 的 相 邻 方位 得 到 。 因 
为 出 口 在 (m,n), 因 此 试探 顺序 规定 为 : 从 当前 位 置 向 前 试探 的 方向 为 从 正 东 ( 即 右边 ) 沿 
顺 时 针 方 向 进行 。 为 了 简化 问题 ,方便 地 求 出 新 点 的 坐标 ,将 从 正 东 开始 沿 顺 时 针 进 行 的 这 
8 个 方向 的 坐标 增 量 放 在 一 个 结构 数组 move[8] 中 ,在 move 数组 中 ,每 个 元 素 由 两 个 域 组 
成 ,x 为 横 坐 标 增 量 ,y 为 纵 坐标 增 量 。 

move 数组 的 定义 如 下 : 


class item 

{ int x, y; 

Fs 

item move[8] ; 

这 样 对 move 的 设计 就 会 很 方便 地 求 出 从 某 点 (x,y) 按 某 一 方向 v(0 志 v7) 到达 的 新 
点 (i,j) 的 坐标 : 

i=x+move[v].x; j=y+move[v].y; 

图 7-13 为 求 迷宫 路 径 方 向 的 示意 图 。 其 中 有 8 个 方向 需要 处 理 ,但 是 启用 一 个 二 维 数 
组 后 可 以 统一 处 理 。 这 样 虽然 统一 ,但 是 每 次 运行 显得 有 点 单调 ,如 果 要 体现 出 老鼠 试探 的 
方向 有 些 随 机 ,那么 算法 上 的 改进 就 是 通过 随机 函数 来 确定 当时 往 前 走 的 方向 ,但 是 带 来 的 
新 间 题 就 是 要 记录 哪些 方向 已 经 走 过 ,哪些 方向 还 可 以 选择 ,这 部 分 实现 起 来 就 会 有 一 定 的 
困难 。 


(x-1,y) 
(x-1, y—1) (x—1, y+1) 


™ 


7 (x,y) ~ 


(x+l,y-1) 人 | 人 (x+1, y+1) 


(x+l,y) 
图 7-13 求 迷宫 路 径 方向 的 示意 图 
第 三 个 问题 是 此 处 的 栈 如 何 设计 。 当 到 达 了 某 点 而 无 路 可 走时 需 返 回 前 一 点 ,再 从 前 
一 点 开始 向 下 一 个 方向 继续 试探 。 因 此 , 压 和 人 栈 中 的 不 仅 是 顺序 到 达 的 各 点 的 坐标 ,而 且 还 
要 有 从 前 一 点 到 达 本 点 的 方向 。 


wawhewb 一 吓 
LLicol-l-|l-lc|x 
-olLiLLel-i-l~ 
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图 7-14 是 利用 栈 保存 迷宫 路 径 示 意图 。 栈 中 每 一 组 数据 是 所 到 达 点 的 坐标 及 从 该 点 
沿 哪个 方向 走 , 走 的 路 线 为 :(1,1); 一 (2,2); 一 


四 3 (3,3)o 一 (3,4)。 一 (3,5)。 一 (3,6)。( 下 标 表 示 方 
45;1 向 ), 当 从 点 (3,6) 沿 方向 0 到 达 点 (3,7) 之 后 ,无 
P30 ER 路 可 走 , 则 应 回 湖 , 即 退回 到 点 (3,6)。 对 应 的 操 
40 340 作 是 出 栈 , 沿 下 一 个 方向 即 方向 1 继续 试探 ,方向 
3.3,0 3.3.0 1、2 试探 失败 ,在 方向 3 上 试探 成 功 ,因此 将 (3， 
2 二 6,3) 压 入 栈 中 , 即 到 达 了 (4,5) 点 。 注 意 ,图 7-14 
了 只 讨论 了 部 分 过 程 。 
让 和 用 各 人 相 栈 中 元 素 是 一 个 由 行 、 列 、 行 走 方向 组 成 的 三 
本 的 千克 国 元 组 , 栈 元 素 的 设计 如 下 ， 
class datatype 
{int x, y, direction ; // 横 坐标 、 纵 坐标 及 方向 


}; 


第 四 个 问题 是 如 何 防止 重复 到 达 某 点 ,以 避免 发 生死 循环 。 第 一 种 方法 是 另外 设置 一 
个 标志 数组 mark[mj[nj, 它 的 所 有 元 素 都 初始 化 为 0, 一 旦 到 达 了 某 一 点 (i,j) 之 后 ,将 
mark[i][j] 置 为 1, 下 次 再 试探 这 个 位 置 时 不 可 行 。 第 二 种 方法 是 当 到 达 某 点 (i, ji) 后 ,将 
maze[ 让 [j] 移 为 一 1, 以 便 区 别 未 到 达 过 的 点 。 本 书 采用 第 二 种 方法 ,算法 结束 前 可 恢复 原 
迷宫 的 数据 。 

迷宫 求解 算法 思想 如 下 : 


加 栈 初始 化 
@ 将 入 口 点 坐标 及 到 达 该 点 的 方向 (初始 值 设 为 -1) 入 栈 
@while ( 栈 不 空 ) 
{ 栈 顶 元 素 =>(x ，Y ，direction) 
出 栈 ， 
求 出 下 一 个 要 试探 的 方向 direction++ 
while (还 有 剩余 试探 方向 时 ) 
{ if (direction 方向 可 走 ) 
则 { (x，Y，direction) 人 栈 ; 
求 新 点 坐标 (i, j ) ; 
将 新 点 (i ，j) 切 换 为 当前 点 (x ，Y) ; 
证 ( (x,y) == (m,n) ) 结束 ， 
else 重 置 direction=0 ; 
} 
else directiont+t+; 
} 
} 


【程序 源码 7-2】 迷宫 求解 程序 部 分 源码 分 析 ( 其 中 数据 结构 定义 为 int mazeLm 十 2][n 十 2]; 
和 item move[8];) 。 


int trymaze: :pfirstth(maze, move){ 
seqstack stack; 
datatype temp; 
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int x, y, direction, row, col; 
temp.x=1; temp.y= 1; temp.direction= —1; 
push_seqstack (stack, temp); 
while (!empty seqstack (stack ) ) 
{ pop_seqstack (stack, &temp); 
X= temp. x; y= temp.y; direction = temp. direction+1; 
while (direction< 8) 
{ row=x+move[direction].x; col =y+ move[direction].y; 
if ( maze[row][col] ==0 ) 
{ temp= {x, y, direction}; 
push seqstack ( stack, temp ); 
x= row; y= col; maze[x][y] =—1; 
if (x== m&&y == n) return 1; // 迷 宫 有 出 口 
else direction= 0; 


} 


else direction++ 7 
} //while (direction< 8) 
} //while 
return 0; // 迷 富 无 出 口 

} 

最 后 栈 中 保存 的 就 是 一 条 迷宫 的 通路 。 

【应 用 案例 7-3〗 下 面 讨论 一 个 小 型 游戏 * 推 箱子 ”的 程序 设计 。 为 了 形象 地 表示 仓 
库 ,约定 用 俯视 的 角度 来 绘制 仓库 ,那么 这 就 是 一 个 具有 二 维 方向 的 平面 关系 (实际 上 有 8 
个 方向 ) ,所 以 自然 要 启用 二 维 数组 。 同 时 要 利用 方向 键 来 控制 箱子 的 移动 ,有 一 定 的 程序 
设计 技巧 。 通 过 本 程序 设计 过 程 , 可 以 了 解 一 个 小 型 游戏 软件 的 开发 细节 、 二 维 数组 的 实际 
编程 应 用 、 数 学 对 程序 设计 的 影响 ,也 进一步 应 用 了 数据 结构 栈 。 

推 箱子 游戏 主要 功能 : 在 DOS 窗口 界面 下 模拟 仓库 管理 员 进 行 推 箱子 ,最 终 目标 为 使 
所 有 箱子 移动 到 特定 的 目标 位 置 。 可 以 通过 设置 关 数 来 提高 难度 和 趣味 性 。 程 序 设 计 中 需 
要 考虑 进入 界面 、 选 关 、 重 新 开始 玩 \ 往 四 个 方向 移动 .不 能 往 前 推动 的 意外 处 理 \ 步 数 统计 、 
最 高 分 记录 等 。 为 了 保证 游戏 正常 运行 ,对 于 不 能 推动 的 情况 下 ,采用 的 是 无 提示 处 理 , 该 
步 无 效 即 可 。 在 移动 过 程 中 ,要 能 同时 处 理 人 与 箱子 同时 移动 和 人 自己 移动 并 存 的 控制 。 
如 果 提 供 后 悔 机 制 , 则 必须 启用 数据 结构 栈 。 当 然 为 了 趣味 性 ,一 般 可 以 只 提供 后 悔 一 步 的 
机 会 ,用 一 个 单元 记录 最 新 走 过 的 位 置 就 可 以 完成 这 个 功能 。 

【程序 源码 7-3】 推 箱子 游戏 部 分 源码 分 析 。 


const roomsize = 9; // 仓 库 内 部 为 正方 形 , 边 长 为 9 

int map[ roomsize + 2][roomsize + 2]; // 推 箱子 房子 布局 的 数据 结构 :二 维 数组 
int data; // 记 录 最 短 步骤 数目 

int times = 0; 

int array[2] = {100, 100}; // 记 录 最 好 成 绩 

char string[30] = "正在 装 和 人 .pp. 本 人 


上 面 是 每 轮 游戏 实际 工作 使 用 的 二 维 数组 ,每 一 关 的 实际 布局 数据 另外 放 在 每 一 个 数 
据 数组 中 ,根据 不 同 的 关 数 ,把 相应 的 数据 填 人 map 即 可 。 如 下 面 为 第 一 轮 游戏 仓库 中 细 
节 布 局 的 数据 结构 : 
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int mapl[roomsize + 2][roomsize+2] = 


{1/0 12,3,4,5,6,7,8,9,10 


1 


{= 
(= diol = 
C= 
tl 
t= 
tl 
{-1,1,0,0,0,0,3,4,0,1, -1}, 
{= 0 0 0 Ly = 
{-1llll,l,l,1,1,1, -1}, 


{-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1} 


}; 


//6 
//7 
//8 
//9 
//10 


对 于 箱子 , 则 必须 把 该 程序 设计 需要 的 各 种 信息 集成 为 一 个 对 象 。 范 例如 下 : 


class box 
{ 
int positionh; 
int positionl; 
int flag; 
int gate; 
int count; 
public: 
box(); 
void begin( ); 
void choose_gate( ); 
void choose() 
void replay(); 
void playing() ; 
void display(); 
void left(); 
void right( ); 
void down(); 
void up(); 
void test_flag(); 
void record(); 


}; 


虽然 内 部 设计 是 二 维 数组 ,但 是 在 显示 器 上 ,最 好 能 利用 各 种 符号 显示 出 比较 理想 的 图 
案 , 更 加 人 性 化 。 下 面 的 显示 函数 就 利用 了 多 种 不 同 的 符号 来 分 别 代表 人 、 仓 库 的 墙 . 箱 子 、 


目标 位 等 。 
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void box: :display() 
{ 


cout << end] << endl << end] << end] << end] << endl; 
for(int i=1;i<= roomsize;i++) 


{ 


// 人 的 位 置 纵 坐标 

// 人 的 位 置 横 坐 标 

// 标 志 位 ,记录 人 在 目标 位 置 上 
// 这 个 变量 是 记录 关 数 

// 这 个 变量 是 记录 步 数 


// 开 始 界面 
// 选 关 提示 

// 游 戏 时 ce 选项 的 提示 
// 重 玩 

// 玩 游戏 时 界面 
// 显 示 地 图 

// 左 方向 

// 右 方向 

// 下 方向 

// 上 方向 

// 过 关 提 示 

// 这 段 函数 为 排行 榜 
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cout << setw(30); 
for(int j=1;j<= roomsize;j++) 


{ 
if(map[i][j] == 0) cout <<" "; 
if(map[i][j] ==1) cout <<" 国 "; // 墙 
if(map[i][j] ==2) cout <"O"; // 目 标 位 置 
if(map[i][j] ==3) cout<<" 友 "; // 箱 子 
证 (map[i][j] == 4) cout <<" 胖 "; // 人 
if(map[i][j] == 5) cout <<"®"; // 箱 子 在 目标 位 置 上 
} 
cout << endl; 


cout << endl << endl; 
cout <<" 选 项 (c)"<<" 步 数 :"<< count << endl; 
} 


程序 开始 运行 后 ,主要 考虑 四 个 方向 的 编程 ,要 把 各 种 意外 情况 全 部 考虑 进去 。 键 盘 上 
的 方向 键 主要 通过 ASCII 码 来 控制 。 下 面 的 函数 为 处 理 往 右 方向 的 箱子 推动 。 


void box: :right() 
{ 
if(map[positionh][positionl +1] == 0) 
{ 
map[ positionh][positionl +1] = 4; 


if(flag==1) 
{map[ positionh][positionl1l] = 2; flag= 0; } 
else 


map[ positionh][positionl] = 0; 
positionl++; 


} 
else if(map[positionh][positionl + 1] == 2) // 人 要 到 目标 位 置 上 
{ 
map[ positionh][positionl +1] = 4; 
if(flag ==1) 
map[ positionh][position]l] = 2; // 恢 复 目 标 位 置 
else 
{ 
map[positionh][position1] = 0; // 恢 复原 来 的 状态 
flag=1; // 标 志 位 ,记录 人 在 目标 位 置 上 
} 
positionl++; 
} 


else if(map[positionh][positionl +1] == 3&&map[ positionh][positionl + 2] == 0) 
// 将 箱子 推 到 空白 位 置 上 
{ 
map[ positionh][positionl + 2] = 3; 
map[ positionh][positionl +1] = 4; 


if(flag==1) 
{ map[positionh][position1] =2; flag=0; } 
else 


map[positionh][position1]=0; 
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positionl++; 
} 
else if(map[positionh][positionl +1] == 5&&map[ positionh][positionl + 2]!= 1) 
// 要 将 箱子 从 目标 位 置 上 推出 
{ 
if(map[positionh][positionl +2] == 2) // 下 一 个 位 置 还 是 目标 位 置 
{ 


map[ positionh][positionl +2] = 5; 
map[ positionh][positionl +1] = 4; 
if(flag==1) 
map[ positionh][position1] = 2; 
else 
{ map[positionh][position1] =0; flag=1; } 
} 
else if(map[positionh][positionl + 2] == 0) // 下 一 个 位 置 是 空白 
{ 
map[ positionh][positionl +2] = 3; 
map[ positionh][positionl +1] = 4; 
if(flag== 1) 
map[ positionh][positionl] = 2; 
else 
{ map[positionh][positionl] = 0; flag=1; } 
} 


positionl++; 


} 
else if(map[positionh][positionl +1] == 3&&map[ positionh][positionl + 2] == 2) 
// 要 将 箱子 推 到 目标 位 置 上 
{ 
map[ positionh][positionl + 2] = 5; // 箱 子 在 目标 位 置 上 
map[ positionh][positionl +1] = 4; 
if(flag==1) // 人 在 目标 位 置 上 
{ map[ positionh][position1] =2; flag=0; } 
else // 人 不 在 目标 位 置 上 


map[ positionh][positionl] = 0; 
positionl++; 


} 


else count ——; // 抵 消 人 不 动 的 情况 
test_flag(); 


} 


读者 完成 这 个 小 程序 后 ,可 以 学 着 去 提高 本 程序 的 视觉 效果 ,例如 能 否 在 Windows 图 
形 界面 上 实现 ,把 这 些 功 能 和 界面 做 得 更 完美 ,同时 支持 鼠标 的 响应 ,还 可 以 增加 音响 效果 。 
为 了 增加 难度 ,在 某 些 位 置 临时 打开 一 个 障碍 墙 。 

可 以 考虑 编写 一 个 计算 机 自动 布局 和 自动 给 出 箱子 个 数 、 初 始 位 置 以 及 人 的 初始 位 置 
等 信息 的 程序 ,这 时 需要 对 随机 函数 有 非常 熟练 的 运用 ,关键 是 确保 有 解 。 因 为 有 时 如 果 箱 
子 的 起 始 位 置 不 对 ,就 根本 无 法 成 功 , 如 开始 就 在 墙角 或 靠 着 边 墙 。 

图 7-15 为 推 箱子 小 游戏 程序 运行 后 的 部 分 界面 图 。 
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ry 了 
(0) 第 一 关 运行 中 界面 (d) 第 一 关 过 关 时 界面 
图 7-15 推 箱子 小 游戏 运行 图 


7.8 广义 表 简 介 


虽然 二 维 数组 具有 二 维 关系 ,但 是 当 把 一 行 数据 或 一 列 数据 看 成 一 个 整体 时 , 它 依然 是 
一 种 特殊 的 线性 表 。 只 不 过 其 中 的 线性 表 的 长 度 是 不 可 以 改变 的 ,其 自身 的 长 度 也 是 不 可 
以 改变 的 。 如 图 7-16 所 示 ,这 里 表现 出 的 是 二 维 关系 和 一 维 关系 的 辩证 统一 ,同时 一 些 高 
级 语言 中 也 可 以 这 么 实现 ,在 定义 时 可 以 通过 一 维 数组 表示 二 维 数组 。 

all a al Bi=(all al a31) 
人 ao22 ) Bs=(a2 a2 a2)  A=(B，B: B;) 


Wel Be 3 Bi3=(al3 a23 a33) 


图 7-16 二 维 数组 是 特殊 线性 表 的 示意 图 


二 维 数组 从 数学 的 角度 是 不 允许 对 某 个 元 素 进 行 插入 和 删除 的 ,但 是 线性 表 本 身 的 属 
性 要 求 考 虑 对 数据 进行 插入 和 删除 ,如果 这 么 做 了 那么 这 是 一 种 什么 数据 结构 呢 ? 它 还 是 
线性 表 吗 ? 如 果 打 破 了 两 个 定 长 的 约束 条 件 , 人 允许 内 部 的 线性 表 长 度 可 以 改变 ,而 且 总 的 线 
性 表 长 度 也 可 以 改变 ,进一步 放宽 条 件 , 内 部 线性 表 的 元 素 还 可 以 是 线性 表 , 而 且 层 数 也 不 
限制 ,那么 线性 表 的 基本 特征 已 经 改变 。 由 于 它 是 从 线性 表演 变 而 来 ,所 以 称 为 广义 线性 表 
(简称 广义 表 ) ,之 前 的 线性 表 可 以 理解 为 一 种 狭义 的 线性 表 , 是 广义 表 的 特例 。 

广义 表 (Generalized List) 是 nCn 过 0) 个 数据 元 素 的 有 限 序列 ,一 般 记 作 : Glist = (Al， 
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A: ,…',Ai,…,A.)。 此 处 使 用 大 写字 母 表示 每 一 个 元 素 可 以 为 表 , 不 一 定 非 是 不 可 拆 分 的 
元 素 , 用 以 区 别 在 线性 表 中 使 用 小 写字 母 表示 元 素 。 

其 中 : Glist 是 广义 表 的 名 称 ,n 是 它 的 长 度 。 每 个 a(1 志 i<n) 是 Glist 的 成 员 , 它 可 以 
是 单个 元 素 , 也 可 以 是 一 个 广义 表 , 分 别称 为 广义 表 Glist 的 单元 素 和 子 表 , 所 以 广义 表 的 
定义 也 是 递归 的 。 

通俗 地 说 ,广义 表 是 由 广义 表 组 成 的 线性 表 ,而 广义 表 可 由 不 可 分 的 元 素 或 者 线性 表 构 
成 。 它 又 称 为 列表 (Lists) ,用 复数 形式 以 示 与 一 般 线性 表 List 的 区 别 。 

广义 表 Glist 非 空 时 , 称 第 一 个 元 素 A, 为 Glist 的 表 头 (head) ,除了 表 头 外 的 其 余 元 素 
组 成 的 表 (As,…,A;,…,A,) 称 为 Glist 的 表 尾 (tail) 。 

下 面 讨论 射击 运动 队 队员 管理 系统 的 数据 结构 设计 。 假 设 为 了 更 好 地 备战 下 一 届 奥 运 
会 ,国家 射击 队 约 定 射 击 项 目 有 两 个 主教 练 , 之 下 带领 多 个 备 赛 小 组 ,每 个 小 组 必须 有 专任 
教练 ,也 可 以 有 多 个 ,而 且 根据 情况 可 以 随时 新 增 小 组 或 撤销 小 组 。 每 个 小 组 的 运动 员 可 以 
是 多 名 ,也 可 以 随时 新 增 和 淘汰 ,并 且 在 运动 员 中 还 可 以 出 现 老 队员 带 新 队员 的 情况 。 那 么 
如 何在 计算 机 内 部 表示 这 种 具有 层次 性 的 关系 呢 ? 方法 之 一 就 是 利用 字符 串 来 处 理 。 约 定 
每 出 现 新 的 一 层 管理 关系 就 启用 新 的 一 层 括号 。 

一 个 射击 运动 队 备 战 团队 的 范例 如 下 : 〈 王 怡 富 , 孙 盛 威 ,( 李 对 鸿 ,( 张 山 )),( 李 旭 阳 ， 
( 唐 宇 通 , 曾 锦 华 )),( 刘 天 游 ,( 马 斯 龙 )),( 李 玉 梅 ,( 王 湘 彦 , (高 黎 泽 ))))。 

从 上 面 的 字符 串 信 息 中 可 以 分 析出 许多 结论 ,运动 队 有 两 个 总 教练 : 王 怡 富 , 孙 盛 威 ， 
一 共有 4 个 备 赛 小 组 , 李 对 鸿 是 张 山 的 教练 , 王 湘 彦 是 一 名 运动 员 , 但 是 他 在 带 一 名 新 队员 
高 黎 泽 等 。 

一 般 可 以 用 大 写字 母 表 示 广 义 表 ,用 小 写字 母 表 示 单 个 数据 元 素 ,广义 表 用 括号 括 起 
来 ,括号 内 的 数据 元 素 用 逗号 分 隔 开 。 下 面 是 一 些 广义 表 的 范例 : 

GLISTO1 =() 

GLIST02 = (a) 

GLIST03 = (a, (b,c,d)) 

GLIST04 = (GLIST01,GLIST02, GLIST03) 

GLIST05 = (a,GLISTOS5) 

GLIST06 = ((a),((),b),c,(d)) 

广义 表 有 时 会 使 用 带 名 字 的 括号 ,这 样 既 表明 每 个 表 的 名 字 , 又 说 明 它 的 组 成 ,下 面 为 
几 个 范例 : 

GLIST03 = (av,GLIST07(b,c,d)) 

GLIST08 = GLISTO9 (a, GLISTO9 (a, GLISTO9 (… ) ) ) 

广义 表 的 性 质 有 : 

(1) 多 层次 。 广 义 表 的 元 素 可 以 是 单元 素 ,也 可 以 是 子 表 , 而 子 表 的 元 素 还 可 以 是 子 表 。 

(2) 可 递归 。 广 义 表 的 定义 并 没有 限制 元 素 的 递归 , 即 广义 表 也 可 以 是 其 自身 的 子 表 。 

(3) 可 共享 。 如 果 某 个 数据 结构 是 其 他 数据 结构 的 一 部 分 ,而 且 一 旦 变化 则 都 会 变 , 那 
么 就 可 以 采用 广义 表 管 理 , 这 样 可 以 节省 很 多 存储 空间 。 

广义 表 的 特性 对 于 它 的 使 用 范围 和 应 用 效果 都 起 到 了 很 大 的 作用 。 

图 7-17 表示 利用 广义 表 共 享 信息 的 方式 ,可 以 看 到 数据 之 间 的 关系 不 一 定 是 线性 关 
系 。 广 义 表 用 双 线 的 椭圆 表示 ,元 素 用 单线 的 椭圆 表示 。 
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含 
CD ea 


常规 线性 表 
tableA=(datal, date2) 


ea 
多 次 共享 表 


tableC=(tableB, tableA) 


表 中 套 表 
tableB=(data3, tableA) 


图 7-17 广义 表 内 部 关系 示意 图 


广义 表 有 两 个 重要 的 基本 操作 , 即 取 表 头 操 作 (Head) 和 取 表 尾 操作 (Tail) 。 

根据 广义 表 的 表 头 、 表 尾 的 定义 可 知 , 对 于 任意 一 个 非 空 的 列表 ,其 表 头 可 能 是 单元 素 
也 可 能 是 列表 ,而 表 尾 必 为 列表 。 

广义 表 ( ) 和 (( )) 不 同 。 前 者 是 长 度 为 0 的 空 表 ,对 其 不 能 做 求 表 头 和 表 尾 的 运算 ; 而 
后 者 是 长 度 为 1 的 非 空 表 (只 不 过 该 表 中 唯一 的 一 个 元 素 是 空 表 ) ,对 其 可 进行 分 解 ,得 到 的 
表 头 和 表 尾 均 是 空 表 () 。 

广义 表 上 可 以 定义 与 线性 表 类 似 的 一 些 操作 ,如 建立 、 插 入 删除 .遍历 ,也 可 以 进一步 
进行 广义 表 分 拆 .连接 .复制 等 。 

由 于 广义 表 结 构 的 复杂 性 ,顺序 存储 结构 难以 胜任 ,所 以 存储 结构 仅 为 链表 结构 ,而且 
这 种 链表 也 需要 进行 一 些 细 节 上 的 改进 。 

广义 表 的 常用 操作 清单 见 表 7-1。 


表 7-1 广义 表 常 用 操作 清单 


操作 名 称 建议 算法 名 称 编程 细节 约定 

创建 广义 表 create( Glist) 根据 广义 表 的 字符 串 形式 创建 一 个 广义 表 

输出 广义 表 dispglist(Glist) 根据 广义 表 链 表 存储 结构 输出 字符 串 结构 

求 表 头 head(Glist) 返回 广义 表 的 头 部 

求 表 尾 tail(Glist) 返回 广义 表 的 尾部 
遍历 出 所 有 数据 ,对 字符 串 而 言 , 等 于 正好 过 滤 掉 所 有 

遍历 traverse(Glist) 括号 和 逗号 ,但 并 不 是 从 字符 串 中 产生 的 ,而 是 从 内 部 
的 链表 存储 结构 上 得 到 该 结果 

判断 广义 表 是 否 为 空 isempty(Glist) 如 广义 表 空 ,返回 True; 否则 返回 False 

判断 广义 表 是 否 相等 isequal(Glist01,Glist02) | 如 两 个 广义 表 完 全 一 样 ,返回 True; 否则 返回 False 

求 表 长 length(Glist) 求 广义 表 的 长 度 ,第 一 层 的 元 素 或 表 的 个 数 

求 表 的 深度 depth(Glist) 求 广义 表 的 深度 ,链表 存储 结构 最 深 的 层次 

查找 元 素 Locate(Glist, data) 在 广义 表 中 查找 数据 元 素 data 是 否 存 在 

修改 元 素 YG odds， | 在 广义 表 中 以 newdata 代 将 所 有 olddata 

合并 子 表 merge(Glist01,Glist02) | 以 Glist01 为 头 、Glist02 为 尾 建立 广义 表 

复制 广义 表 copy(Glist01,Glist02) | 复制 广义 表 , 按 Glist01 建立 另外 相同 的 广义 表 Glist02 


由 于 链接 存储 中 的 指针 较为 灵活 ,便于 解决 广义 表 的 共享 与 递归 问题 ,采用 链表 存储 结 
构 来 存储 广义 表 是 很 好 的 选择 。 
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在 链接 存储 方式 下 ,每 个 数据 元 素 都 用 一 个 结 点 表示 。 

广义 表 通 常 有 两 种 存储 方案 ,下 面 分 别 介绍 。 

(1) 头 尾 表示 法 。 

头 尾 表示 法 : 若 广义 表 不 空 , 则 可 分 解 成 表 头 和 表 尾 ; 反之 ,一 对 确定 的 表 头 和 表 尾 可 
唯一 地 确定 一 个 广义 表 。 头 尾 表示 法 就 是 根据 这 一 性 质 设计 而 成 的 一 种 存储 方法 。 

由 于 广义 表 中 的 数据 元 素 既 可 能 是 列表 也 可 能 是 单元 素 , 相 应 地 , 头 尾 表示 法 中 结 点 的 结 
构 形 式 也 有 两 种 : 一 种 是 表 结 点 ,用 以 表示 列表 ; 另 一 种 是 原子 结 点 ,用 以 表示 单元 素 。 在 表 结 
点 中 应 该 包括 一 个 指向 表 头 的 指针 和 指向 表 尾 的 指针 ; 而 在 元 素 结 点 中 存储 单元 素 的 元 素 值 。 

为 了 区 分 这 两 类 结 点 ,在 结 点 中 还 要 设置 一 个 标志 域 。 如 果 标 志 为 0, 则 表示 该 结 点 为 
原子 结 点 ; 如 果 标 志 为 1, 则 表示 该 结 点 为 子 表 结 点 。 

头 尾 表示 法 的 结 点 形式 和 广义 表 范 例如 图 7-18 所 示 。 

tag headp tailp GlistD=(11,(22,33,44)) 


1 | 十 tableD 
由 TUT3HOTA 


(a) 表 结 点 结构 


DLL3TTL3LTUIAI 
tag atomdata 
0 | 数据 0 [33 0144 
(b) 原子 结 点 结构 (c) 一 个 广义 表 的 范例 


图 7-18 头 尾 表示 法 的 结 点 形式 和 广义 表 范 例 


从 上 述 存 储 结构 示例 中 可 以 看 出 ,采用 头 尾 表示 法 容易 分 清 列表 中 单元 素 或 子 表 所 在 的 
层次 。 例 如 ,在 广义 表 GlistD 中 ,单元 素 22.33、44 在 同一 层次 上 。 另 外 ,最 高 层 的 表 结 点 的 个 
数 即 为 广义 表 的 长 度 。 例 如 ,在 广义 表 GlistD 的 最 高 层 有 2 个 表 结 点 ,其 广义 表 的 长 度 为 2。 

由 于 结 点 结构 使 用 了 联合 体 , 可 以 做 到 三 个 域 和 两 个 域 的 结 点 共存 ,代码 中 如 下 。 


class gnode // 定 义 广义 表 的 结 点 结构 
{ 
public: 
int tag; //0 代表 原子 结 点 ,1 代表 子 表 结 点 
union 
{ 
char atomdata; // 原 子 数 据 
gnode * headp, * tailp; // 指 向 表 头 和 表 尾 
}value; 


}; 


(2) 孩子 兄弟 表示 法 。 

广义 表 的 另 一 种 存储 法 称 为 孩子 兄弟 表示 法 ,也 有 两 种 结 点 形式 : 一 种 是 有 孩子 结 点 ， 
用 以 表示 列表 ; 另 一 种 是 无 孩子 结 点 ,用 以 表示 单元 素 。 在 有 孩子 结 点 中 包括 一 个 指向 第 
一 个 孩子 (长 子 ) 的 指针 和 一 个 指向 兄弟 的 指针 ; 而 在 无 孩子 结 点 中 包括 一 个 指向 兄弟 的 指 
针 和 该 元 素 的 元 素 值 。 

为 了 能 区 分 这 两 类 结 点 ,在 结 点 中 还 要 设置 一 个 标志 域 。 如 果 标 志 为 1, 则 表示 该 结 点 
为 有 和 孩子 结 点 ; 如 果 标 志 为 0, 则 表示 该 结 点 为 无 孩子 结 点 。 
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孩子 兄弟 表示 法 的 结 点 形式 和 广义 表 范 例如 图 7-19 所 示 。 


tag headp tailp GlistD=(11,(22,33.44)) 
1 | > tableD 
十 | 1 作 
(a) 表 结 点 结构 
0[ PLL [IA 

tag atomdata tailp 

0 [数据 [二 加 因 医 上 回国 本 上 加 四 隐 
(b) 原子 结 点 结构 (0) 一 个 广义 表 的 范例 


图 7-19 孩子 兄弟 表示 法 的 结 点 形式 和 广义 表 范 例 示 意图 


从 图 示 的 存储 结构 中 可 以 看 出 ,采用 孩子 兄弟 表示 法 时 ,表达 式 中 的 左 括号 “(” 对 应 存 
储 表示 中 的 tag 二 1 的 结 点 , 且 最 高 层 结 点 的 tailp 域 必 为 NULL。 

定义 的 结 点 结构 使 用 了 联合 体 ,虽然 都 是 3 个 域 ,但 是 中 间 域 的 含义 是 完全 不 同 的 , 代 
码 如 下 。 


class gnode // 定 义 广义 表 的 结 点 结构 
{ 
public: 
int tag; //0 代表 原子 结 点 ,1 代表 子 表 结 点 
union 
{ 
char atomdata; // 原 子 数 据 
gnode * headp; // 指 向 表 头 
}value; 
gnode * tailp; // 指 向 表 尾 


}; 


在 编程 处 理 广义 表 的 过 程 中 ,输入 广义 表 直 接 采 用 了 其 逻辑 结构 的 表示 方法 , 即 字符 
串 。 进 入 内 存 后 转换 成 链表 结构 ,对 于 处 理 结果 ,把 链表 结构 输出 成 字符 串 结构 。 

由 于 广义 表 既 可 以 表示 线性 结构 ,也 可 以 表示 非 线 性 结构 ,而 且 可 有 效 地 利用 存储 空 
间 , 因 此 在 计算 机 编程 中 ,很 多 复杂 场合 都 可 以 使 用 广义 表 来 表示 。 


(a) 使 用 默认 广义 表 (b) 求 广义 表 表 头 (c) 求 广义 表 表 尾 
图 7-20 广义 表 基 本 功能 程序 运行 界面 
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7.9 二 维 码 简介 


大 家 使 用 的 二 维 码 只 是 二 维 条 码 中 的 一 种 ,简称 为 QR 码 , 即 Quick-Respose。 这 种 二 
维 码 的 全 称 是 “快速 响应 矩阵 码 *。1994 年 ,这 种 黑白 相间 的 方块 图 案由 日 本 DENSO 
WAVE 公司 发 明 ,2000 年 经 过 ISO 审核 成 为 国际 标准 。QR 码 有 明显 的 特征 : 3 个 “ 回 ” 方 
块 ,这 是 用 于 定位 的 ,以 任意 角度 扫描 均 可 读 出 编码 。 现 在 已 有 了 微型 QR 码 和 可 插入 图 形 
的 QR 码 ,开发 人 员 没 有 申请 专利 ,宣布 任何 人 可 以 免费 使 用 QR 码 , 其 编码 技术 完全 公开 ， 
或 者 称 Open Source。 二 维 码 一 共有 40 个 尺寸 ,版 本 记 为 Version。Version 1 是 21X21 的 
矩阵 ,Version 2 是 25X25 的 矩阵 ,Version 3 是 29X29, 每 增加 一 个 Version ,就 会 增加 边 长 
4, 公 式 是 : (V 一 1) X4 十 21(V 是 版 本 号 ) ,最 高 Version 40,(40 一 1) X4 十 21 王 177, 所 以 最 
高 是 177X177 的 正方 形 。 二 维 码 的 数据 结构 和 内 部 布局 如 图 7-21 所 示 。 


一 一 下- 一 空白 区 


一 位 置 探 测 图 形 


eg | | 一 位 置 探测 图 形 | 功能 
分 隔 符 图 形 
一 定位 图 形 符号 


一 校正 图 形 


了 编码 区 
版 本 信息 格式 


十 -数据 和 纠 错 码 字 


图 7-21 二 维 码 数据 结构 示意 图 


7.10 本 章 总 结 


本 章 主要 介绍 了 具有 二 维 关系 的 数据 结构 一 一 二 维 数组 的 逻辑 结构 ,存储 结构 和 基本 
操作 的 算法 设计 。 由 于 它 和 和 抢 阵 的 同一 性 , 故 有 着 广泛 的 应 用 。 本 章 还 讨论 了 各 种 特殊 矩 
阵 的 压缩 存储 。 通 过 图 示 和 讨论 ,展示 了 二 维 数组 的 工作 原理 和 优点 :还 给 出 了 多 种 存储 方 
法 。 最 后 给 出 了 程序 设计 案例 ,包括 迷宫 问题 的 求解 ,多 次 使 用 二 维 数 组 ; 推 箱子 小 游戏 程 
序 设计 则 从 应 用 层面 给 读者 一 个 非常 有 乐趣 的 程序 设计 角度 。 


习 题 
一 、 原 理 讨论 题 
1. 诸如 迷宫 、 八 皇后 .棋盘 等 课题 使 用 什么 数据 结构 是 比较 好 的 选择 ? 为 什么 ? 
2. 二 维 数组 和 线性 表 是 什么 关系 ? 
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3. 为 什么 二 维 数 组 中 不 能 进行 数据 的 插 删 操作 ? 

二 、 理论 基本 题 

1. 写 出 以 下 概念 的 定义 : 数组 、 下 标 , 行 优先 、 列 优先 。 

2. 写 出 二 维 数组 的 主要 操作 清单 。 

3. 示意 图 : 画 出 行 优先 和 列 优先 存储 结构 的 示意 图 ,并 且 讨论 纵向 和 横向 的 关系 是 如 
何 保持 的 ,给 出 地 址 计算 公式 。 

4. 画 出 几 种 特殊 矩阵 存储 结构 的 地 址 计算 示意 图 。 

5. 画 一 个 6X7 的 稀 政 矩 阵 ( 非 零 元 素 只 有 4 个 ) , 画 出 对 应 的 三 元 组 表示 法 。 

6. 自己 给 出 一 个 稀 朴 矩阵 ,然后 画 出 该 数据 结构 的 十 字 链 表示 意图 。 

、 编 程 基本 题 

编程 实现 几 种 特殊 矩阵 的 地 址 计算 公式 。 

编程 实现 稀疏 矩阵 和 三 元 组 的 互 换 。 

编程 实现 稀 玖 矩阵 的 转 置 。( 两 种 不 同 的 思路 分 别 实现 ) 
、 编程 提高 题 

.编程 实现 稀疏 矩阵 的 三 元 组 的 加 法 。 

.编程 实现 十 字 链 表 的 基本 运算 。 

.编程 实现 迷宫 问题 的 求解 。 

. 编程 实现 推 箱子 小 游戏 的 程序 设计 。 

编程 实现 贪 吃 蛇 小 游戏 的 程序 设计 。 

五 、 思 考题 

1. 课程 表 的 输入 和 显示 。 要 求 从 键盘 上 输入 每 周 七 天 中 上 午 两 个 单元 (每 个 单元 两 节 
课 ) 、 下 午 两 个 单元 (每 个 单元 两 节 课 )、 晚 间 一 个 单元 (每 个 单元 两 节 课 或 三 节 课 ) 的 课程 安 
排 。 然 后 在 屏幕 上 用 二 维 结构 显示 安排 表 , 要 有 分 隔 线 、 标 题 等 表格 信息 ,注意 : 有 的 时 间 
段 可 以 没有 课程 。 课 名 要 求 使 用 中 文 显示 (这 并 不 意味 着 输入 时 必须 用 中 文 ) 。 如 果 能 同时 
处 理 其 他 信息 则 更 好 ,如 授课 教师 .地 点 等 。 最 好 能 同时 提供 以 下 功能 : 可 以 打印 ,可 以 用 . 
txt 或 其 他 格式 存储 在 硬盘 的 文件 中 。 

2. 本 章 所 有 地 址 计算 公式 都 是 从 原型 到 存储 结构 的 地 址 计算 ,需要 做 反 向 地 址 计算 公 
式 推导 。 如 在 对 称 和 矩阵 压缩 存储 实现 的 一 维 数组 中 ,任何 一 个 元 素 应 该 是 原 和 矩阵 哪 一 个 位 
置 上 的 元 素 ? 即 计算 出 它 原 来 的 行 、 列 下 标 值 。 

3. 请 分 析 和 象棋 中 特殊 棋子 的 合法 走 法 ,如 : 马 、 象 . 士 等 。 可 以 设 某 个 棋子 目前 的 位 置 
坐标 为 (rowcol) ,然后 用 函数 的 方法 把 它 可 能 的 所 有 合法 走 法 的 位 置 表示 出 来 。 

4. 五 子 棋 是 一 款 益 智 游戏 。 它 要 求 双方 不 断 下 子 ,任何 一 方 如 果 先 排 成 横向 、 纵 向 、 斜 
向 45" 或 斜 向 135" 连 续 的 五 个 子 ,就算 胜利 。 读 者 需要 做 的 分 析 是 如 何 判断 胜利 。 当 然 , 进 
一 步 可 以 考虑 设计 棋盘 ,棋子 的 落 子 、 悔 棋 等 机 制 的 实现 ,也 可 以 进行 实际 编程 ,同时 分 析 其 
中 使 用 了 哪些 数据 结构 。 

5. 俄罗斯 方块 游戏 也 是 一 款 大 家 熟知 的 游戏 。 这 个 游戏 有 个 很 大 的 难度 , 它 要 求 从 上 
方 随 机 出 现 一 些 不 规则 排列 在 一 起 的 方块 体 ,之 后 可 以 使 用 键盘 进行 旋转 方向 左右 移动 、 
快速 下 移 、 暂 时 停 移 等 控制 ,目的 是 在 自动 落 到 底部 之 前 调整 好 方位 ,尽量 出 现 同 一 排 的 方 
块 全 部 填 满 而 消失 后 整体 下 降 一 层 。 请 写 一 个 报告 ,讨论 一 下 这 个 问题 中 可 能 涉及 的 数据 
结构 和 重要 的 编程 环节 。 


pS 
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第 8 章 ， 二 又 树 、 树 和 森林 的 构造 
与 应 用 


现实 生活 中 有 树 和 森林 等 非 线 性 数据 结构 ,但 在 存储 时 会 遇 到 困难 。 本 童 主要 介绍 二 
叉 树 以 及 它 的 存储 结构 ,重点 介绍 二 叉 树 的 遍历 等 主要 操作 ; 讨论 二 叉 树 的 输入 和 输出 ; 
介绍 多 种 二 叉 树 的 应 用 ,如 线索 二 叉 树 和 最 优 二 又 树 ,特别 给 出 表达 式 计 算 的 程序 源码 ; 最 
后 给 出 二 叉 树 和 树 .森林 之 间 的 相互 转换 规则 。 


8.1 引 


了 中 


在 处 理 现 实 关系 模型 进行 编程 时 ,虽然 很 多 情况 下 都 是 一 维 线性 关系 ,但 是 还 必须 处 理 
更 复杂 的 非 线 性 关系 ,如 “ 树 ” 形 结构 或 “森林 ” 形 结构 。 

现实 生活 中 有 很 多 关系 模型 是 按照 层次 关系 展开 的 。 例 如 一 所 大 学 由 多 所 学 院 组 成 ， 
一 所 学 院 由 多 个 系 组 成 ,一 个 系 由 多 个 专业 组 成 ,一 个 专业 由 多 个 班级 组 成 ,一 个 班级 由 多 
名 学 生 组 成 。 这 样 的 组 织 方式 使 得 整个 大 学 的 结构 非常 清晰 ,它们 从 上 到 下 都 是 “一 对 多 ” 
的 关系 。 类 似 关系 还 有 军队 的 构成 ( 军 、 师 、 旅 . 团 、 营 、 连 、 排 \ 班 ,十 兵 )、 公 司 的 构成 (分 公 
司 、 部 门 、 小 组 ,工作 人 员 ) 等 ,这 些 都 是 树 形 结构 。 

树 (Tree) 是 n(n 宇 0) 个 有 限 数据 元 素 的 集合 。 当 n==0 时 , 称 这 棵 树 为 空 树 。 在 一 棵 非 
空 树 工 中 : 

(1) 有 一 个 特殊 的 数据 元 素 称 为 树 的 根 结 点 , 根 结 点 没有 直接 前 趋 结 点 。 

(2) 车 n>1, 除 根 结 点 之 外 的 其 余数 据 元 素 被 分 成 mCm 二 0) 个 互 不 相交 的 集合 T,， 
Ts，…,T。 ,其 中 每 个 集合 T;(1 二 i 之 m) 又 是 一 棵 树 。 树 Ti ,T: ,…,T。 称 为 这 个 根 结 点 的 
子 树 。 

树 的 定义 是 一 个 递归 的 概念 ,即使 用 了 “ 树 ” 来 定义 “ 树 ”。 

树 的 定义 可 以 形式 化 地 描述 为 二 元 组 的 形式 : T=(D,R) ,其 中 D 为 树 工 中 结 点 的 集 
合 ,R 为 树 中 结 点 之 间 关 系 的 集合 。 

通常 把 这 种 “一 对 多 ”的 关系 画 成 如 图 8-1 所 示 的 示意 图 ,为 了 简化 ,所 有 学 院 、 系 、 专 业 
名 称 等 用 编号 表示 。 
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图 8-1 “一 对 多 ”关系 的 示意 图 


本 章 的 基本 概念 可 以 从 以 下 三 个 不 同 的 角度 来 展开 : 

(1) 基于 人 类 的 家 族 发 展 史 。 中 国 历史 悠久 ,有 一 些 家 庭 有 传承 “族谱 ?的 习惯 。 按 照 
父系 制 ,一 个 家 庭 可 能 有 多 个 儿子 ,每 个 儿子 又 组 成 新 的 家 庭 ,而 女儿 和 没有 儿子 的 人 将 中 
止 记录 。 这 样 的 发 展 过 程 就 是 树 形 结构 ,可 以 把 其 中 的 一 些 关系 术 语 直接 用 于 讨论 数据 结 
构 , 如 儿子 父亲、 兄弟 .祖先 等 。 

(2) 基于 大 自然 中 的 树 和 森林 。 由 于 大 自然 中 的 树 是 先 有 一 个 根 , 再 有 一 个 主干 ,再 有 
一 些 分 支 , 然 后 是 树叶 ,很 吻合 要 讨论 的 “一 对 多 ?关系 ,所 以 也 采用 一 批 现 实生 活 中 树 的 术 
语 ,如 叶子 、 树 根 等 。 

(3) 基于 数学 的 抽象 。 有 一 些 概念 利用 上 面 的 体系 无 法 表达 ,那么 就 给 出 数学 化 的 抽 
象 术语 。 

这 三 种 体系 在 下 面 混 合 使 用 ,并 不 独立 使 用 某 一 套 体 系 。 

(1) 结 点 。 要 处 理 的 实体 。 在 树 中 就 是 一 个 数据 元 素 的 表示 。 通 常用 圆圈 (或 椭圆 ) 和 
字母 表示 。 

(2) 边 。 一 对 多 关系 ,现实 中 树 结构 中 边 应 该 有 方向 ,但 是 在 画 出 了 层次 和 分 支 关系 
后 , 边 的 方向 通常 被 省 略 。 

(3) 结 点 的 度 。 结 点 所 拥有 的 子 树 的 个 数 称 为 该 结 点 的 度 。 

(4) 叶 ( 子 ) 结 点 。 度 为 0 的 结 点 称 为 叶 ( 子 ) 结 点 ,或 者 称 为 终端 结 点 。 

(5) 分 支 结 点 。 度 不 为 0 的 结 点 称 为 分 支 结 点 .或 者 称 为 非 终 端 结 点 。 一 棵 树 的 结 点 
除 叶子 结 点 外 ,其 余 都 是 分 支 结 点 。 

(6) 儿子 结 点 。 树 中 某 一 个 结 点 的 子 树 的 根 结 点 称 为 这 个 结 点 的 儿子 结 点 (或 称 为 孩 
子 结 点 、 子 女 结 点 )。 

(7) 父亲 结 点 。 如 果 结 点 X 有 儿子 结 点 Y, 那 么 这 个 X 结 点 就 称 为 Y 的 父亲 (或 称 为 
双亲 结 点 ) 。 互 为 父子 关系 的 两 个 结 点 为 父子 关系 。 

(8) 兄弟 关系 。 具 有 同一 个 父亲 的 结 点 间 互 称 为 兄弟 关系 。 

(9) 堂 兄 弟 结 点 。 若 某 些 结 点 的 父亲 为 兄弟 关系 , 则 它们 之 间 为 堂 见 弟 关系 。 

(10) 路 径 、 路 径 长 度 。 如 果 一 棵 树 的 一 串 结 点 nm ,nz,…,nk 有 如 下 关系 : 结 点 ni 是 
nit1 的 父亲 结 点 (二 i 过 k) ,就 把 n ,ns ,… ,ns 称 为 一 条 由 m 至 nk 的 路 径 。 这 条 路 径 的 长 度 
是 k 一 1。 

(11) 祖先 结 点 、 子 孙 结 点 。 从 根 结 点 到 该 结 点 的 沿路 所 有 分 支 上 的 结 点 都 是 该 结 点 的 
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祖先 结 点 ; 反之 就 是 子孙 结 点 。 
(12) 结 点 的 层 数 。 约 定 根 结 点 层 数 为 1, 其 余 结 点 层 数 等 于 它 的 父亲 结 点 层 数 加 1 。 
(13) 树 的 深度 。 树 中 所 有 结 点 的 最 大 层 数 称 为 树 的 深度 (也 称 高 度 )。 
(14) 树 的 度 。 树 中 各 结 点 度 的 最 大 值 称 为 该 树 的 度 。 
(15) 有 序 树 。 兄 弟 关系 的 结 点 次 序 如 果 是 敏感 的 \ 不 能 任意 调换 的 , 则 称 为 有 序 树 。 
(16) 无 序 树 。 兄 弟 关系 的 结 点 次 序 是 无 所 谓 的 、 可 以 任意 调换 的 , 则 称 为 无 序 树 。 
(17) 森林 。 若 干 棵 互 不 相交 的 树 组 成 的 集合 称 为 森林 。 一 棵 树 就 是 森林 的 特例 。 
图 8-2 是 图 8-1 的 树 抽象 后 逻辑 结构 示意 图 ,以 下 为 部 分 结论 : A 是 树 的 根 ,A 是 B.C、 
D 的 父亲 ,B 是 A 的 儿子 ,B.C.D 是 兄弟 关系 ,G 和 H 是 堂 兄 弟 关系 ,J、,K、L 是 叶子 结 点 。 


8-2 ” 树 逻 辑 结构 的 示意 图 


从 树 的 定义 和 图 示 可 以 看 出 , 树 具有 下 面 两 个 特点 : 

(1) 树 的 根 结 点 没有 前 趋 结 点 ,除根 结 点 之 外 的 所 有 结 点 有 且 只 有 一 个 前 趋 结 点 。 

(2) 树 中 所 有 结 点 可 以 有 零 个 或 多 个 后 继 结 点 。 

这 就 是 树 结构 的 层次 性 和 分 支 性 。 

与 现实 生活 中 的 树 不 一 样 ,森林 和 树 是 可 以 互相 转化 的 辩证 统一 关系 。 可 以 把 多 棵 树 的 
根 连接 在 一 起 ,用 一 个 新 的 结 点 管理 ,这 样 森林 又 变 成 了 树 。 一 所 大 学 中 每 个 学 院 都 有 信息 管 
理 系统 ,但 是 互 不 相连 ,信息 无 法 共享 ,这 就 是 森林 结构 。 一 旦 全 校 把 所 有 信息 管理 系统 整合 
了 ,这 样 大 学 就 成 为 新 的 根 结 点 ,全 部 信息 的 关系 又 成 为 树 , 但 是 全 国 的 大 学 又 互 不 相关 ,从 教 
育 部 的 角度 看 就 是 森林 ,继续 整合 把 全 国 的 大 学 统一 管理 起 来 ,就 构成 了 一 棵 更 大 的 树 。 

反之 ,任何 一 棵 树 , 删 去 根 结 点 就 变 成 森林 ,所 以 树 或 者 森林 就 是 关注 一 些 信息 与 其 相 
互 关 系 的 层面 ,并 不 是 先天 就 必然 是 树 或 者 森林 。 

树 的 常用 操作 见 表 8-1。 

表 8-1 树 的 常用 操作 


操作 名 称 建议 算法 名 称 编程 细节 约定 

树 初 始 化 inittree(tree) 初始 化 一 棵 空 树 tree 

求 根 结 点 treeroot(data) 求 结 点 data 所 在 树 的 根 结 点 

求 父 亲 结 点 parent(tree, data) 求 树 tree 中 结 点 data 的 父亲 结 点 

求 儿子 结 点 child(tree, data,i) 求 树 tree 中 结 点 data 的 第 i 个 儿子 结 点 

求 兄 弟 结 点 rightsibling(tree, data) 求 树 tree 中 结 点 data 的 第 一 个 右边 兄弟 结 点 


142 


第 8 章 “二叉树 、 树 和 森林 的 构造 与 应 用 


续 表 
操作 名 称 建议 算法 名 称 编程 细节 约定 
si 结 点 

插入 树 treeinsert(tree, data,i, sroot) petted 外 作为 二 
删除 树 treedelete(tree, data,i) 在 树 tree 中 删除 结 点 data 的 第 i 棵 子 树 

树 tree 的 遍历 操作 , 即 按 某 种 方式 访问 树 tree 中 
遍历 树 treetraverse( tree) 的 每 个 结 点 , 且 使 每 个 结 点 至 多 被 访问 一 次 和 至 

少 被 访问 一 次 。 


由 于 树 中 儿子 结 点 个 数 不 确定 ,如 何 存储 树 结构 就 会 面临 困难 。 能 节省 空间 的 思路 主 
要 是 依靠 反 向 思维 ,虽然 儿子 个 数 不 确 定 , 但 是 任意 一 个 结 点 (根除 外 ) 的 父亲 结 点 却 是 唯一 
的 。 利 用 这 个 唯一 性 ,推出 了 下 面 的 顺序 存储 方法 。 

(1) 父亲 表示 法 。 启 用 一 组 连续 的 存储 空间 (如 一 维 结构 体 数组 ) ,存储 树 中 的 所 有 结 
点 和 它们 各 自 对 应 的 父亲 结 点 所 在 的 下 标 地 址 。 

图 8-3 为 父亲 表示 法 的 示意 图 。 图 中 parent 域 的 值 为 一 1 ,表示 该 结 点 无 双亲 结 点 , 即 
该 结 点 是 一 个 根 结 点 。 


node father 
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8-3 ”父亲 表示 法 的 示意 图 


父亲 表示 法 的 优点 是 存储 量 相对 固定 ,比较 节省 空间 ,查找 父亲 很 容易 ,但 若 求 某 结 点 
的 所 有 和 孩子 结 点 ,需要 遍历 整个 数组 。 此 外 这 种 存储 方式 较 难 反映 各 兄弟 结 点 之 间 的 关系 。 
由 于 在 实际 编程 中 更 多 的 是 从 父亲 访问 儿子 ,所 以 这 种 存储 方案 有 很 大 的 局 限 性 。 

上 述 顺 序 存储 只 方便 从 儿子 访问 父亲 结 点 ,存在 编程 不 方便 的 缺点 ,下 面 讨论 利用 链接 
结构 解决 树 的 存储 问题 。 高 级 语言 中 并 不 支持 链表 结 点 中 的 链 域 个 数 任意 改变 的 结构 定 
义 , 因 此 不 可 能 开发 出 链 域 数量 不 统一 的 结 点 来 处 理 树 结 点 分 支 数 的 不 统一 。 

(2) 定 长 链表 法 。 本 方法 主要 采用 所 有 结 点 中 最 大 的 儿子 个 数 作为 结 点 中 的 链 域 个 
数 。 其 结 点 的 存储 表示 类 似 描述 为 : 

# define Maxnum < 树 中 结 点 儿子 的 最 大 个 数 > 

class treenode 

int data; 


treenode * son[Maxnum] ; 
}; 


图 8-4 是 定 长 为 4 链表 法 的 示意 图 。 
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EF 
cl. IAIA| [IIAIA 
\ 


EIAIAIAJIFIAIAI 人 A GIAIAIA| [HIAIAI 人 ^ 
图 8-4 定 长 链表 法 的 示意 图 


这 种 存储 方法 的 缺点 是 明显 的 。 其 一 是 付出 的 空间 代价 太 大 ,特别 是 叶子 结 点 有 大 量 
的 链 域 空置 ,其 次 ,根据 树 结构 的 动态 性 完全 可 能 再 次 出 现 比 儿子 个 数 的 最 大 值 还 大 的 儿子 
个 数 ,此 时 出 现 溢出 ,程序 无 法 正常 运行 下 去 。 

(3) 顺序 和 链接 联合 存储 法 ,有 时 也 称 为 "儿子 表示 法 ”。 其 主要 的 特点 就 是 把 所 有 
儿子 结 点 使 用 链表 管理 起 来 ,实际 上 处 理 的 是 兄弟 关系 , 结 点 的 多 少 可 以 根据 实际 情况 
变化 ,解决 了 儿子 个 数 不 统一 带 来 的 问题 , 结 点 信息 用 数组 存储 。 其 优点 是 查找 儿子 结 
点 比较 容易 ; 缺点 是 付出 了 一 些 空间 代价 ,儿子 结 点 个 数 过 多 还 会 带 来 处 理 时 的 时 间 效 
率 下 降 。 

图 8-5 是 顺序 和 链接 联合 存储 的 示意 图 。 要 注意 链表 结 点 中 的 两 个 域 都 应 该 理解 为 指 
针 , 第 一 个 域 中 虽然 是 数字 ,但 是 这 些 数字 实际 上 是 相应 数据 在 数组 中 的 下 标 , 当 然 也 是 一 
种 地 址 ,如 A 存储 在 0 号 单元 中 , 它 的 第 一 个 儿子 结 点 信息 存储 在 1 号 单元 中 ,就 是 B。 第 
二 个 域 是 真正 的 链表 , 它 的 指针 指向 该 结 点 的 下 一 个 儿子 ,这 些 结 点 的 地 址 是 临时 向 操作 系 
统 申 请 的 ,不 需要 了 解 它们 的 实际 地 址 。 
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8-5 ”顺序 和 链接 联合 存储 示意 图 


在 儿子 表示 法 中 查找 父亲 比较 困难 ,查找 儿子 却 十 分 方便 , 故 适用 于 一 般 的 应 用 。 

儿子 表示 法 已 经 有 一 定 的 实用 价值 ,一 般 情况 下 ,如 果 需 要 从 某 个 结 点 找 其 父亲 结 点 ， 
通常 通过 栈 结构 完成 ,因为 从 根 进 入 , 沿 着 一 系列 的 结 点 下 移 , 返 回 的 路 径 正好 依次 是 父亲 
结 点 。 如 果 需 要 用 最 直接 的 方法 访问 父亲 结 点 ,可 以 把 上 面 的 思路 联合 在 一 起 ,组 成 一 个 新 
方案 ,就 是 父亲 儿子 顺序 链接 联合 表示 法 。 还 可 以 启用 栈 来 管理 进入 的 路 径 , 返 回 时 不 断 出 
栈 即 可 。 

上 面 给 出 了 多 种 存储 方法 ,但 是 从 编程 角度 看 大 都 有 人 缺点。 森林 结构 由 多 棵 树 组 成 ,以 
上 问题 依旧 存在 ,而 且 还 要 另外 处 理 多 棵 树 之 间 的 关系 ,所 以 不 再 深入 讨论 。 

树 结构 之 所 以 存储 结构 比较 困难 ,其 重要 原因 是 儿子 结 点 的 个 数 不 固 定 , 有 的 可 能 很 
大 ,有 的 很 少 甚至 没有 。 如 果 考 虑 动态 操作 ,其 儿子 个 数 时 多 时 少 ,这 个 问题 就 会 更 加 复杂 ， 
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所 以 希望 现实 生活 中 的 树 形 结构 儿子 结 点 最 大 个 数 越 少 越 好 ,这 样 就 会 减少 儿子 个 数 不 确 
定 带 来 的 麻烦 ,显然 不 能 是 一 个 ,会 退化 为 线性 表 , 所 以 最 小 值 应 该 是 2。 科 学 家 们 为 此 发 
明了 一 种 新 的 数据 结构 一 一 二 叉 树 ,下 一 节 将 开始 重点 讨论 。 

【应 用 案例 8-1】 军事 演习 中 双方 军事 力量 的 模型 。 在 计算 机 中 管理 红 方 和 蓝 方 的 部 
队 力 量 时 ,各 自 的 部 队 格局 可 以 是 完全 不 一 样 的 ,如 红 方 可 能 有 海 、 陆 . 空 3 种 兵种 ,而 蓝 方 
有 导弹 部 队 和 特种 部 队 ,而 且 双 方 的 兵力 也 没有 直接 的 关系 ,各 自 是 一 棵 树 , 从 演习 总 指挥 
部 的 角度 看 这 就 是 一 个 森林 。 

【应 用 案例 8-2】 汽车 整 车 的 构成 与 成 本 分 析 系 统 。 汽 车 制造 厂 对 于 整 车 的 成 本 核算 
并 不 是 基于 线性 结构 ,因为 很 多 零件 是 标准 配件 ,分 布 在 很 多 不 同 的 部 件 上 ,首先 要 把 汽车 
的 总 体 构成 做 成 一 个 数据 结构 ,这 就 是 一 棵 树 。 

【应 用 案例 8-3】〗 计算 机 对 弈 树 。 计 算 机 可 以 与 人 进行 棋 类 (如 和 象棋、 围棋、 国际 象棋 
等 ) 对 弈 ,而 且 大 部 分 时 候 一 般 人 还 战胜 不 了 计算 机 。 原 理 很 简单 , 那 就 是 在 计算 机 内 部 构 
造 了 一 棵 很 大 的 树 ,把 对 弈 中 所 有 可 能 的 情况 都 先 设计 好 ,计算 机 总 是 选择 有 利于 自己 一 方 
下 棋 , 一 般 人 很 难 想到 很 多 步骤 ,所 以 人 与 计算 机 对 弈 失败 的 概率 就 大 一 些 。 计 算 机 实现 人 
机 对 弈 还 有 很 多 细节 要 考虑 ,但 是 大 的 思路 就 是 要 构造 一 棵 * 胜 败 对 弈 树 ”。 

【应 用 案例 8-4】〗 目录 树 。Windows 操作 系统 和 早期 的 DOS 磁盘 操作 系统 一 样 ,文件 
都 是 通过 文件 夹 管理 的 (DOS 下 叫做 子 目 录 ) ,约定 文件 夹 下 还 可 以 有 文件 夹 , 这 样 就 构成 
了 一 棵 树 形 结构 ,为 了 在 屏幕 上 显示 所 有 多 层 目 录 或 文件 夹 .或 者 实现 DOS 下 的 dir/s 命令 
( 即 一 次 性 逐 级 显示 全 部 根 目 录 和 子 目 录 下 的 文件 ) ,必须 进行 树 的 遍历 。 

【应 用 案例 8-5】 前 面 章节 提 到 的 经 典 问 题 “ 八 皇后 问题 ”, 在 求解 过 程 中 会 涉及 计算 
机 状态 树 的 概念 ,因为 处 理 过 程 不 是 根据 某 种 确定 的 计算 法 则 ,而 是 利用 试探 和 回溯 的 探索 
技术 求解 。 为 了 求 得 合理 布局 ,在 计算 机 中 要 存储 布局 当前 状态 。 从 最 初 的 布局 状态 开始 ， 
一 步 步 地 进行 试探 ,每 试探 一 步 形 成 一 个 新 的 状态 ,整个 试探 过 程 形 成 了 一 棵 隐 含 的 状态 
树 。 如 图 8-6 所 示 ( 为 了 简化 过 程 ,此 处 将 八 皇 后 问题 简化 为 四 皇后 问题 ) 。 回 渊 法 求解 过 
程 实质 上 就 是 遍历 状态 树 。 
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图 8-6 “四 皇后 问题 "的 计算 机 状态 树 的 部 分 示意 图 
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8.2 ”二叉树 及 其 逻辑 结构 


由 于 树 和 森林 中 儿子 个 数 的 差异 性 和 动态 性 给 其 存储 结构 带 来 了 复杂 性 ,计算 机 科学 
家 发 明了 一 种 新 的 数据 结构 ,这 就 是 二 叉 树 。 由 于 二 叉 树 是 非 线性 结构 ,使 得 程序 设计 技巧 
和 数据 结构 的 应 用 更 加 深入 和 复杂 。 

二 叉 树 (Binary Tree) 是 有 限 元 素 的 集合 ,该 集合 或 者 为 空 , 或 者 由 一 个 称 为 根 (root) 的 
元 素 及 两 个 不 相交 的 、 被 分 别称 为 左 子 树 和 右 子 树 的 二 叉 树 组 成 。 该 定义 是 递归 的 。 

在 二 叉 树 中 ,一 个 元 素 也 称 作 一 个 结 点 。 当 集合 为 空 时 , 称 该 二 叉 树 为 空 二 叉 树 。 

二 叉 树 是 有 序 的 , 即 若 将 其 左 、 右 子 树 颠 倒 , 就 成 为 男 一 棵 不 同 的 二 叉 树 , 树 中 某 个 结 点 
只 有 一 棵 子 树 时 要 区 分 它 是 左 子 树 还 是 右 子 树 ( 这 是 二 叉 树 与 树 之 间 的 基本 区 别 点 ) ,因此 
二 叉 树 具有 5 种 基本 形态 : 空 二 叉 树 ,只 有 根 、 只 有 左 儿 子 (Lechild)、 只 有 布 儿子 (Rehild)、 
左右 两 个 儿子 都 存在 的 二 叉 树 ,如 图 8-7 所 示 。 


RE 


空 二 又 本 只 有 只 有 只 有 j 左 右 两 个 儿子 
二叉树 有 根 左 儿 子 右 儿子 有 左右 两 个 儿子 


图 8-7 二 叉 树 的 5 种 基本 形态 示意 图 


树 的 相关 概念 在 本 节 继 续 使 用 ,如 结 点 的 度 、 叶 子 结 点 、 分 枝 结 点 、 儿 子 、 父 亲 、 兄 弟 、 路 
径 、 路 径 长 度 、 祖 先 、 子 孙 、 结 点 的 层 数 、 树 的 深度 、 树 的 度 等 。 

以 下 介绍 几 个 新 的 术语 。 

(1) 左 儿子 、 右 儿子 。 一 个 父亲 可 以 有 两 个 儿子 结 点 ,它们 互 称 为 兄弟 。 注 意 儿子 必须 
有 左 、 右 特性 ,所 以 分 别称 为 左 儿 子 、 右 儿子 。 

(2) 满 二 又 树 。 在 一 棵 二 叉 树 中 ,如 果 所 有 分 枝 结 点 都 存在 左 子 树 和 右 子 树 , 并 且 所 有 
叶子 结 点 都 在 同一 层 上 ,这样 的 一 棵 二 又 树 称 作 满 二 又 树 。 

下 面 启用 一 套 编号 体系 : 对 满 二 又 树 中 的 结 点 按 从 左 到 右 、 从 上 至 下 的 顺序 进行 编号 ， 
1.2、3、4 直到 n。 如 图 8-8(a) 是 一 棵 满 二 又 树 ,图 8-8(b) 则 不 是 满 二 又 树 。 


(a) 满 二 又 树 (b) 非 满 二 又 树 
图 8-8 满 二 叉 树 和 非 满 二 叉 树 的 示意 图 


(3) 完全 二 又 树 。 一 棵 深度 为 k 的 有 mn 个 结 点 的 二 叉 树 ,如 果 其 中 任何 结 点 的 编号 
i(1 志 in) 与 满 二 又 树 中 编号 为 i 的 结 点 位 置 完全 相同 , 则 这 棵 二 叉 树 称 为 完全 二 叉 树 。 
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完全 二 又 树 的 特点 是 : 叶子 结 点 只 能 出 现在 最 下 层 和 次 下 层 , 且 最 下 层 的 叶子 结 点 连续 
出 现在 树 的 左 部 。 满 二 又 树 必 定 是 完全 二 又 树 ,而 完全 二 又 树 未 必 是 满 二 又 树 。 
如 图 8-9 所 示 , 图 (a) 就 是 一 棵 完全 二 叉 树 ,图 (b) 是 非 完全 二 叉 树 。 


(a) 完全 二 又 树 (b) 非 完全 二 叉 树 
图 8-9 完全 二 叉 树 和 非 完全 二 叉 树 的 示意 图 
二 叉 树 有 以 下 几 个 主要 性 质 ; 


性 质 1 一 棵 非 空 二 又 树 的 第 i 层 上 最 多 有 2 王 :个 结 点 (i 之 1)。 

性 质 2 一 棵 深度 为 k 的 二 叉 树 中 ,最 多 具有 2* 一 1 个 结 点 。 

性 质 3 对 于 一 棵 非 空 的 二 又 树 ,如 果 叶 子 结 点 数 为 no ,度数 为 2 的 结 点 数 为 ns , 则 有 
no 一 nz 十 1。 

性 质 4 具有 nm 个 结 点 的 完全 二 又 树 的 深度 k 为 | logzn | 十 1。 

性 质 5 对 于 具有 nm 个 结 点 的 完全 二 叉 树 ,如果 按照 上 面 的 编号 体系 对 二 又 树 中 的 所 
有 结 点 从 1 开始 顺序 编号 , 则 对 于 任意 的 序号 为 i 的 结 点 ,有 : 

(1) 如 果 i 人 1, 则 序号 为 i 的 结 点 的 父亲 结 点 的 序号 为 Li/2 |; 如 果 i 二 1, 则 序号 为 i 的 
结 点 是 根 结 点 ,无 父亲 结 点 。 

(2) 如 果 2 x* i<n, 则 序号 为 i 的 结 点 的 左 儿 子 结 点 的 序号 为 2*i; 如 果 2 * in, 则 序 
号 为 i 的 结 点 无 左 儿 子 。 

(3) 如 果 2 * i 十 1 委 n, 则 序号 为 i 的 结 点 的 右 儿 子 结 点 的 序号 为 2* i 十 1; 如 果 2*i 十 1 二 
n, 则 序号 为 i 的 结 点 无 右 儿 子 。 

(4) 若 结 点 i 序 号 为 奇数 且 不 等 于 1, 则 它 的 左 兄 弟 序 号 为 i 一 1。 

(5) 若 结 点 i 序 号 为 偶数 且 不 等 于 n, 它 的 右 兄 弟 序 号 为 i 十 1。 

(6) 结 点 i 所 在 层 数 (层次 ) 为 | logsi | 十 1。 

如 果 对 二 叉 树 的 根 结 点 从 0 开始 编号 , 则 i 号 结 点 的 父亲 结 点 编号 为 | (i 一 1)/2 | , 左 儿 
子 的 编号 为 2* i 十 1, 右 儿子 的 编号 为 2* (i 十 1)。 

表 8-2 为 二 叉 树 的 常用 操作 清单 。 


表 8-2 二叉树 的 常用 操作 清单 


操作 名 称 建议 算法 名 称 编程 细节 约定 
二 叉 树 初始 化 btreeinit( btree) 初始 化 一 棵 空 二 又 树 btree 
求 根 btreeroot(data) 求 结 点 data 所 在 二 叉 树 的 根 结 点 
求 父亲 father(btree, data) 求 二 叉 树 btree 中 结 点 data 的 父亲 结 点 
求 左 儿 子 lchild( btree, data) 求 二 叉 树 btree 中 结 点 data 的 左 儿子 结 点 
求 右 儿 子 rchild(btree, data) 求 二 叉 树 btree 中 结 点 data 的 右 儿 子 结 点 

把 以 sroot 为 根 结 点 的 二 叉 树 插入 到 二 叉 树 

二 叉 树 插入 左 儿 子 | btreeinsertl(btree,dataysroot) btree 中 作为 结 点 data 的 左 子 树 
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续 表 
操作 名 称 建议 算法 名 称 编程 细节 约定 
过 把 以 sroot 为 根 结 点 的 二 叉 树 插入 到 二 叉 树 
二 叉 树 插入 右 儿 子 | btreeinsertr(btree, data, sroot) btree 中 作为 结 点 data 的 右 子 树 
二 叉 树 删除 结 点 btreedelete( btree, data) ne tns 一 般 情 况 下 被 
二 叉 树 tree 的 遍历 操作 , 即 按 某 种 方式 访问 二 叉 
二 叉 树 遍历 btreetraverse(btree) 树 tree 中 的 每 个 结 点 , 且 使 每 个 结 点 只 被 访问 一 
次 (后 面 会 讨论 多 种 遍历 方式 ) 


其 他 的 操作 ,如 二 叉 树 的 构建 ,二 叉 树 的 空间 释放 、 求 二 叉 树 结 点 个 数 、 查 找 结 点 ,修改 
结 点 ,复制 二 叉 树 .二叉树 的 相似 性 比较 、 所 有 左右 儿子 的 切换 、 结 点 的 详细 信息 等 ,可 以 根 
据 需 要 情况 进行 讨论 。 


8.3 二叉树 的 顺序 存储 


二 叉 树 本 身 是 一 种 非 线 性 结构 ,但 是 下 面 要 讨论 如 何 用 一 种 线性 结构 的 顺序 存储 方式 
进行 存储 。 所 谓 二 又 树 的 顺序 存储 ,就 是 用 一 组 连续 的 存储 单元 依次 存放 二 又 树 中 的 结 点 ， 
约定 次 序 是 二 叉 树 结 点 从 上 到 下 、 从 左 到 右 的 编号 顺序 存储 。 此 时 结 点 在 存储 位 置 上 的 前 
趋 后 继 关 系 并 不 是 它们 在 逻辑 上 的 父子 关系 ,必须 找到 其 编号 体系 之 间 隐 含 的 父子 关系 ,这 
种 存储 法 才 有 意义 。 

利用 二 叉 树 的 性 质 可 以 找到 这 种 关系 ,显然 满 二 叉 树 或 完全 二 叉 树 采用 顺序 存储 法 比 
较 合 适 ,这 样 既 能 够 最 大 限度 地 节省 存储 空间 ,又 可 以 利用 数组 元 素 的 下 标 值 确定 结 点 在 二 
叉 树 中 的 位 置 以 及 结 点 之 间 的 关系 。 位 置 为 i 的 结 点 的 左 儿 子 和 右 儿 子 结 点 的 编号 应 该 为 
2i 和 2i 十 1; i 的 父亲 结 点 的 位 置 应 该 为 | i/2 | , 根 结 点 除外 。 

图 8-10(a) 为 完全 二 叉 树 的 顺序 存储 示意 图 ,显然 对 于 满 二 叉 树 是 连续 存放 数据 的 。 基 
于 上 面 推出 的 一 套 编号 系统 , 当 编 号 和 下 标 吻合 后 ,就 相当 于 已 经 有 了 地 址 计算 公式 ,它们 
可 以 表示 出 父子 关系 、 兄 弟 关系 等 。 


(a) 完全 二 叉 树 (b) 一 般 二 叉 树 
图 8-10 完全 二 叉 树 的 顺序 存储 示意 图 
但 是 如 果 不 是 满 二 又 树 和 完全 二 叉 树 ,为 了 保证 上 面 提 到 的 地 址 计算 公式 继续 有 效 ,也 
就 必须 按照 完全 二 又 树 的 对 应 位 置 编号 进行 存储 ,这 样 就 必然 出 现 很 多 所 谓 “ 空 置 " 空 间 ( 注 
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意 这 些 地 址 中 还 是 有 数据 的 ) ,特别 是 一 直 是 单 枝 的 右 子 树 对 空间 的 浪费 达到 最 大 ,因为 一 
棵 深度 为 k 的 右 单 枝 树 , 只 有 上 个 结 点 , 却 需 分 配 2* 一 1 个 存储 单元 。 因 为 此 种 情况 下 , 数 
据 已 经 没有 依次 连续 存放 ,这 时 就 不 是 顺序 存储 了 ,当然 也 不 是 链接 存储 ,在 二 又 树 不 是 满 
二 叉 树 或 者 完全 二 叉 树 时 ,这 种 存储 方案 没有 太 大 的 价值 。 


8.4 ”二叉树 的 链接 存储 


二 又 树 的 链接 存储 结构 是 指 用 链表 来 表示 一 棵 二 又 树 , 即 用 指针 来 管理 元 素 的 父子 关 
系 。 因 为 二 叉 树 最 多 只 有 两 个 儿子 ,所 以 启用 两 个 链 域 就 够 用 ,至 于 数据 域 的 个 数 ,可 以 根 
据 实 际 编程 需要 决定 。 

通常 每 个 结 点 由 三 个 域 组 成 ,除了 数据 域外 ,有 两 个 指针 域 ,分 别 用 来 给 出 该 结 点 左 儿 
子 和 右 儿 子 结 点 的 存储 地 址 。 约 定 data 域 存放 数据 信息 ; Lehild 与 Rehild 分 别 存 放 指 向 
左 儿子 和 右 儿 子 的 指针 , 当 左 儿子 或 右 儿子 不 存在 时 ,相应 指针 域 值 为 空 (图 示 中 用 符号 人 ， 
程序 中 用 NULL 表示 )。 如 果 为 了 返回 父亲 结 点 更 加 容易 ,可 以 增加 一 个 链 域 ,指向 该 结 点 
的 父亲 结 点 。 这 种 存储 结构 既 便于 查找 儿子 结 点 ,又 便于 查找 父亲 结 点 ; 但 是 它 增加 了 空 
间 的 开销 。 具 体 设 计 示意 图 见 图 8-11。 


IChild | data | rChild IChild | data | rChild | father 
(a) 一 般 结 点 构造 (b) 带 有 父亲 链 域 的 结 点 
root 
人 [a 千 二 
Be 
(¢) 入 |e | 和 
(©) 二 叉 树 逻辑 结构 实例 (d) 二 叉 树 对 应 的 链表 结构 


8-11 二 叉 树 的 二 叉 链表 示意 图 


由 于 二 叉 树 的 程序 通常 把 根 结 点 作为 进入 结 点 ,所 以 车 从 某 个 结 点 回 返 到 该 结 点 的 父 
亲 结 点 ,采用 栈 就 可 以 。 从 根 到 某 个 结 点 和 从 该 结 点 退回 到 根 正好 是 反 序 ,而 且 就 是 走 过 的 
所 有 路 径 ,这 也 正 是 栈 结构 保护 现场 的 作用 ,这 样 就 不 必 启 用 父亲 链 域 。 

二 叉 树 的 二 叉 链表 存储 在 C++ 语言 中 用 对 象 表示 : 


class node 
{ 
char data; // 此 处 的 数据 类 型 根据 需要 修改 ,此 处 定义 为 字符 
node * lchild; 
node * rchild; 
node * father; // 指 向 父亲 结 点 的 链 域 , 一般 不 需要 
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8.5 ”二叉树 的 构建 和 数据 显示 


二 叉 树 作为 树 或 者 森林 等 数据 结构 的 替代 品 ,应 该 通过 一 些 转换 规则 来 创建 ,另外 有 些 
数据 模型 本 身 是 可 以 通过 约定 来 形成 和 二 叉 树 的 关系 ,如 后 面 将 会 介绍 到 的 数学 表达 式 。 
由 于 本 章 重点 研究 二 叉 树 的 主要 操作 ,那么 能 否 直 接 建立 二 叉 树 呢 ? 问 题 的 关键 是 如 何 把 
非 线性 关系 通过 一 种 线性 结构 来 体现 出 来 。 下 面 讨论 几 种 建立 二 又 树 的 思路 。 

由 于 二 叉 树 的 功能 众多 ,超过 了 10 个 ,为 了 菜单 的 健壮 性 和 用 户 的 方便 性 ,采用 字符 型 
变量 来 存储 用 户 选 项 ,除了 数字 外 使 用 了 左手 边 便于 用 户 输入 的 常用 键 位 ,如 a、s、d。 

(1) 第 一 种 输入 法 : 默认 广义 表 。 

(2) 第 二 种 输入 法 : 键盘 输入 广义 表 。 

(3) 第 三 种 输入 法 : 新 建树 根 (逐个 输入 ) 。 

(4) 增加 儿子 数据 。 

(5) 删除 叶子 结 点 或 根 (要 求 无 任何 儿子 )。 

(6) 移动 当前 工作 指针 。 

(7) 查找 结 点 并 修改 结 点 信息 。 

(8) 用 广义 表 和 缩 格 法 同时 显示 二 叉 树 。 

(9) 3 种 递归 根 式 遍历 。a 为 三 种 非 递归 根 式 遍历 。s 为 层次 遍历 。d 为 查看 树 结 点 以 
及 叶子 信息 。 

为 了 方便 用 户 使 用 其 他 功能 ,可 以 使 用 第 一 种 输入 法 直接 选择 默认 的 两 个 广义 表 , 一 个 
比较 简单 , 另 一 个 则 相对 复杂 。 读 者 也 可 以 用 第 二 种 输入 法 从 键盘 输入 广义 表 。 第 三 种 输 
入 法 则 提供 了 更 为 人 性 化 的 二 叉 树 构建 方式 ,可 以 通过 第 (3) 和 第 (4) 两 项 功能 逐一 增加 数 
据 来 构建 二 叉 树 。 在 第 (5) 和 第 (7) 项 功能 分 别提 供 了 数据 的 删除 、 查 找 和 修改 等 常用 功能 。 
为 了 达到 这 样 的 效果 ,本 程序 用 当前 工作 指针 的 概念 ,用 来 标注 当前 可 以 修改 、 插 入 儿子 或 
删除 的 结 点 。 

在 屏幕 上 如 何 输出 二 叉 树 也 是 程序 设计 的 难点 。 首 先 本 程序 可 以 把 用 户 不 论 用 什么 方 
式 构建 的 二 又 树 继续 用 广义 表 的 方式 显示 ,这 里 虽然 没有 直接 采用 文件 ,但 是 稍微 修改 后 就 
可 以 达到 存盘 以 及 重新 读 和 的 功能 ,另外 还 提供 了 非常 有 特点 的 缩 格 显示 方式 ,可 以 从 横向 
角度 把 二 又 树 的 层次 关系 很 形象 地 显示 出 来 ,这 对 于 非 线 性 结构 在 平面 关系 上 如 何 显示 提 
供 了 一 个 很 好 的 思路 。 

程序 设计 如 果 仅 为 实现 一 部 分 功能 ,存储 结构 就 会 是 比较 单一 的 形式 ,如果 增加 了 更 多 
的 功能 后 ,有 些 操作 会 变 得 较 慢 ,就 可 以 通过 增加 存储 结构 的 复杂 性 和 牺牲 一 些 空间 来 换取 
时 间 效 率 。 在 这 个 程序 中 ,为 了 能 及 时 切换 当前 工作 指针 的 位 置 ,也 为 了 提供 二 叉 树 其 他 相 
关 信 息 ,在 链表 作为 二 叉 树 的 基本 存储 结构 外 ,还 增加 了 父亲 结 点 指针 father 和 结 点 深度 信 
息 域 deep。 另 外 启用 了 一 条 单 链表 ,同时 以 进入 先后 的 次 序 管理 所 有 数据 ,其 下 一 个 结 点 
的 链 域 为 next。 这 是 非常 有 意义 的 一 种 设计 , 它 为 数据 结构 的 综合 应 用 和 举一反三 提供 了 
良好 的 范例 。 但 除了 空间 代价 外 ,要 维护 这 些 附 加 的 数据 结构 也 要 付出 管理 上 的 时 间 成 本 。 
如 删除 结 点 操作 ,首先 是 从 二 叉 树 结构 中 查找 到 该 结 点 ,那么 如 何 确定 其 在 单 链表 中 的 位 置 
呢 ? 可 以 把 此 处 的 单 链表 改 为 双向 链表 ,通过 增加 空间 的 代价 来 轻松 解决 此 问题 。 但 如 继 
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续 使 用 单 链表 , 则 必须 在 单 链表 中 重新 查找 一 次 ,确定 尾随 指针 的 正确 位 置 ,以 确保 正确 的 
删除 该 结 点 。 具 体 设计 示意 图 见 图 8-12。 


IChild | data | rChild IChild | data | rChild | deep | father next | 


(a) 一 般 二 叉 树 结 点 (b) 本 程序 调整 后 的 结 点 


广义 表 : a(a,c(.d)) 
@ © 先 根 遍历 : (a,b,c,d) 
中 根 遍历 : (bacd) 
(a) 后 根 遍历 : (hdca) 
(9 二 叉 树 结构 (d) 对 应 的 广义 表 和 名 种 诞 历 结 


8-12 范例 程序 中 结 点 构造 示意 图 


二 叉 树 对 应 的 广义 表 写 法 约定 : 先 把 根 结 点 写 下 来 ,然后 用 括号 ,依次 书写 左 儿子 和 右 
儿子 。 如 果 某 个 结 点 下 面 还 有 儿子 , 则 以 此 方式 继续 书写 ; 如 果 没 有 左 儿 子 , 则 在 括号 后 面 
先 写 逗 号 ,然后 再 写 右 儿 子 。 

【程序 源码 8-1】 二 又 树 常见 操作 实现 的 部 分 源码 。 


// 二 叉 树 常见 操作 

# include < windows.h> 

# include < iostream> 

# include < iomanip > 

# include < fstream > 

using namespace std; 

enum returninfo {success, fail, overflow, underflow, nolchild, norchild, nofather, havesonl, 
havesonr, haveason, havetwosons, range_error, quit 


}; // 定 义 返 回信 息 清单 

# define Maxsize 100 // 定 义 广义 表 数 组 的 长 度 
char defaultbtreel[] = "a(b,c(,d))"; // 默 认 广 义 表 数 据 表示 的 二 又 树 范例 1 
char defaultbtree2[] ="a(b(c(d,e),f(,g)),h(i,j))"; // 默 认 广 义 表 数据 表示 的 二 叉 树 范例 2 
class node 
{ 

friend class btree; // 二 叉 树 类 的 友 元 类 
public: 


node(char initdata = '0', int initdeep = 0,node * initl=NULL,node * initr = NULL, 
node * initf = NULL, node * initn= NULL); 


一 node() {}; 
protected: 
char data; // 二 叉 树 结 点 中 的 数据 ,此 处 定义 为 字符 
int deep; // 设 置 二 叉 树 结 点 的 深度 
node * 1child; // 左 儿子 
node * rchild; // 右 儿子 
node * father; // 父 亲 结 点 
node * next; // 用 单 链表 处 理 所 有 结 点 时 指向 下 一 个 结 点 


}; 
node: :node(char initdata, int initdeep, node * initl,node * initr,node * initf,node * initn) 
{ 
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data = initdata; 
deep = initdeep; 
lchild= initl; 
rchild= initr; 
father = initf; 
next = initn; 

: 

class stackdata 


{ 
friend class btree; 
private: 
node * link; 
int flag; 
public: 
stackdata( ){}; 
~stackdata( ){}; 
}; 
class btree 
{ 
private: 
char btreedata[ Maxsize]; 
Char answer; 
node * root; 
node * workinp, * linkrear; 
int btreecount; 
bool firstbracket; 


int countnow; 

int leafcount; 

int countall; 

int sondeep; 

public: 

btree(node * initrootp); 

btree() 

{ 
root = NULL; 
firstbracket = 1; 
countall = 0; 
btreecount = 0; 

}; 

~btree() {}; 

void initfirstbracket(); 

returninfo createbtree( int choice); 


// 创 建 一 个 stackdata 类 ,在 非 递归 遍历 算 
// 法 中 需要 


// 创 建 一 个 二 叉 树 类 


// 广 义 表 字 符 数组 

// 用 于 回答 菜单 选项 

// 指 向 根 结 点 位 置 的 指针 

// 定 义 一 个 工作 指针 ,尾部 指针 

// 结 点 个 数 计数 器 

// 显 示 广义 表 时 处 理 第 一 个 括号 ,为 1 是 ， 
// 变 成 0 就 不 是 了 

// 每 一 次 需要 使 用 计数 器 时 临时 保存 该 值 


// 创 建 儿子 结 点 时 保存 当前 深度 


// 递 归 函 数 内 部 统计 结 点 个 数 
// 二 叉 树 统计 后 的 结 点 个 数 


// 把 第 一 个 括号 标志 位 恢复 成 1 


// 根 据 广义 表 字 符 串 生成 二 叉 树 ,choice = 1 为 默认 数据 ,2 为 键盘 输入 


returninfo createroot(); 

void visit(node * searchp); 
void showbtreedata( ); 

int rgetcount(node * searchp); 
int getcount(); 


// 建 立 树 根 函数 

// 访 问 当前 结 点 数据 域 

// 在 主 界面 中 显示 当前 工作 数组 
// 递 归 统计 二 叉 树 中 的 结 点 个 数 
// 记 录 二 又 树 中 的 结 点 个 数 


returninfo changeworkinpp( ); 
returninfo findnode( ); 
returninfo addchild(); 
returninfo deletenode( ); 
returninfo getinformation( ); 
returninfo gliststravel(node * searchp); 
returninfo indenttravel(node * searchp); 
returninfo preorder (node * searchp); 
returninfo inorder (node * searchp); 
returninfo postorder (node * searchp); 
returninfo nrpreorder (node * searchp); 
returninfo nrinorder (node * searchp); 
returninfo nrpostorder (node * searchp); 
returninfo levelorder (node * searchp); 
}; 
returninfo btree: :createbtree( int choice) 
// 广 义 表 字 符 串 生成 链接 存储 二 叉 树 
{ 
bool startbuild; 
char charnow; 
node * newnode; 
startbuild= 0; 
if(root == NULL) 
startbuild= 1; 
else 


{ 
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// 将 工作 指针 指向 左 儿 子 、 右 儿子 或 者 父亲 
// 查 找 结 点 

// 增 加 左 儿子 或 者 右 儿 子 

// 删 除 结 点 

// 获 取 二 叉 树 结 点 和 叶子 信息 
// 以 广义 表 glists 表示 法 输出 二 叉 树 
// 以 缩 格 表示 法 输出 二 叉 树 

// 递 归 先 根 遍 历 

// 递 归 中 根 遍历 

// 递 归 后 根 遍 历 

// 非 递归 先 根 遍 历 

// 非 递归 中 根 遍历 

// 非 递归 后 根 遍 历 

// 层 次 遍历 


// 判 断 是 否 可 以 开始 建立 二 叉 树 


// 开 始 默认 为 不 能 建立 二 又 树 


cout <<" 安 全 提示 : 原 二 叉 树 已 经 建立 ,操作 将 会 将 其 中 数据 全 部 破坏 !"<< endl; 


cout <<" 您 确认 继续 进行 此 操作 (Y|Y) :”; 


cin >> answer; 
if(answer == 'Y'| |answer == 'y') 


{ 


// 此 处 应 该 把 原 二 叉 树 的 所 有 结 点 空间 用 后 根 遍 历法 或 链表 遍历 法 释放 空间 ,暂时 没有 提供 


startbuild= 1; 
} 
else 
{ 
return fail; 
} 
} 
if(startbuild== 1) 
， 
if(choice== 1) 
{ 


cout << endl <<"1. 范例 1( 简 单 广义 表 ) 2. 范例 2( 复 杂 广义 表 ) "<< endl; 


cin>> choice; 
if(choice == 1) 


strcpy(btreedata, defaultbtreel ); 


else if(choice== 2) 


strcpy(btreedata, defaultbtree2); 


else 
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return fail; 


else 


cout <<" 广 义 表 表示 法 输入 二 又 树 (注意 用 英文 输入 法 ) : "<< endl; 
cout <<" 注 意 : 首位 必须 是 一 个 字母 !"<< endl; 
cout <<"【 范 例 : a(b(c,d),d(,g)) 】"<< endl; 


cin>> btreedata; // 字 符 数组 
} 
root = new node(btreedata[ 0],1); // 把 第 一 个 数据 给 树 根 
workinp = root; // 建 立 当 前 工作 指针 
linkrear = root; // 记 录 链 表 尾 部 ,为 在 后 面 添加 新 结 点 做 
// 准 备 
for(int i=1; btreedata[i]!= \0'; i++) // 从 第 二 个 数据 起 到 最 后 的 数据 为 止 ,循环 
// 处 理 
{ 
charnow = btreedata[ i]; 
switch(charnow) 
{ 
case '(': 
if(btreedata[i+1]==',') 
{ 
i=i+2; // 连 续 往 后 走 两 步 , 跳 过 括号 和 逗号 


sondeep = workinp- > deep+1; // 产 生 目 前 结 点 的 深度 
newnode = new node( btreedata[ i], sondeep); 

newnode 一 > lchild = NULL; 

newnode -> rchild = NULL; 

workinp -> rchild = newnode;  // 右 儿子 

newnode — > father = workinp; 

linkrear — > next = newnode; // 从 后 面 添加 


linkrear = newnode; // 尾 指针 后 移 
i++ // 再 走 一 步 ,到 下 一 个 字符 
} 
else 
{ 
到 本 // 往 后 走 一 步 , 到 字符 处 
sondeep = workinp 一 > deep+1; // 产 生 目 前 结 点 的 深度 
newnode = new node( btreedata[ i], sondeep); 
newnode 一 > lchild = NULL; 
newnode 一 > rchild = NULL; 
workinp -> lchild = newnode; ”// 左 儿子 
newnode 一 > father = workinp; 
linkrear — > next = newnode; // 从 后 面 添 加 
linkrear = newnode; // 尾 指针 后 移 
workinp = workinp -> lchild; ”// 指 针 移 位 
break; 
Case ',': 
+ // 往 后 走 一 步 ,到 字符 处 
workinp = workinp — > father; // 指 针 移 位 
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sondeep = workinp -> deep + 1; // 产 生 目 前 结 点 的 深度 
newnode = new node( btreedata[ i], sondeep); 

newnode — > lchild = NULL; 

newnode 一 > rchild = NULL; 


workinp - > rchild = newnode; // 右 儿子 
newnode — > father = workinp; 
linkrear — > next = newnode; // 从 后 面 添加 
linkrear = newnode; // 尾 指针 后 移 
workinp = workinp 一 > rchild; // 指 针 移 位 
break; 

case ') 


workinp = workinp 一 > father; 
break; 
default: 
return fail; 
break; 
} 
linkrear -> next = NULL; // 确 保单 链表 最 后 一 个 结 点 的 链 域 为 空 


} 
return success; 
. 
returninfo btree: :gliststravel(node * searchp) 
// 以 广义 表 表示 法 输出 二 叉 树 ,递归 ,类 似 先 根 遍 历 
{ 
if(firstbracket == 1) 
{ 
searchp = root; 
cout <<" 以 广义 表 表 示 法 输出 二 又 树 结果 :"; 
} 
if( searchp!= NULL) 
{ 
firstbracket = 0; 
cout << searchp— > data; 
if(searchp—> lchild!= NULL| | searchp - > rchild!= NULL) 
{ 
cout <<"("; 
gliststravel(searchp -> lchild); // 递 归 处 理 左 子 树 
if(searchp—> rchild!= NULL) 
cout ee 
gliststravel(searchp -> rchild); // 递 归 处 理 右 子 树 


cout <<")"; 


} 


return success; 
} 
returninfo btree: :indenttravel(node * searchp) 
// 以 缩 格式 形式 输出 二 叉 树 ,递归 算法 
{ 
if(firstbracket == 1) 
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searchp = root; 
cout << endl << endl <<" 以 缩 格式 形式 输出 二 叉 树 结果 : "<< endl << endl1; 


} 


if( searchp!= NULL) 


{ 


子 空 "<< endl; 


子 空 "<< endl; 
} 
} 


firstbracket = 0; 
cout << setw( searchp - > deep * 3)<<" "<< searchp -> deep <<" ©—>"; 
// 如 何 能 显示 左右 呢 

visit(searchp); 
if(searchp == workinp) 

cout <<" <== 此 结 点 为 当前 工作 指针 位 置 !"; 
cout << endl; 
indenttravel(searchp -> lchild); 
if(searchp—> lchild== NULL) 

cout << setw( searchp - > deep * 3 + 3)<<" "<< searchp - > deep + 1 <<" 加 一 > 左 儿 


indenttravel(searchp -> rchild); 
if(searchp—> rchild== NULL) 
cout << setw( searchp - > deep * 3 + 3)<<" "<< searchp - > deep + 1 <<" 加 一 > 右 儿 


return success; 


} 


图 8-13 为 二 又 树 常用 功能 构建 二 又 树 和 显示 结 点 信息 图 。 


二 又 树 结果 ，acbceccd-e?.fC-g2?-hCioj27 


此 -范例 (简单 广义 表 ) 
肖 前 广义 表 为 : 
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2. 范 例 2 (复杂 广义 表 ) 


图 8-13 ”二叉树 常用 功能 构建 二 叉 树 和 显示 结 点 信息 图 
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8.6 ”二叉树 的 根 序 遍历 


8.6.1 根 序 遍历 的 定义 和 通 扫 算法 实现 


在 二 叉 树 的 众多 操作 中 ,遍历 是 最 基础 和 最 重要 的 操作 ,因为 它 是 其 他 操作 的 基本 前 
提 。 本 节 主 要 讨论 遍历 的 方法 和 实现 。 

二 叉 树 的 遍历 是 指 按 照 某 种 规律 访问 二 叉 树 中 的 所 有 结 点 ,每 个 结 点 被 访问 一 次 且 仅 
被 访问 一 次 。 

遍历 是 二 叉 树 中 经 常 要 用 到 的 一 种 操作 ,因为 在 实际 应 用 问题 中 ,常常 需要 按 一 定 逻辑 
顺序 对 二 又 树 中 的 每 个 结 点 逐个 进行 访问 ,查找 具有 某 一 特点 的 结 点 ,然后 对 这 些 满 足 条 件 
的 结 点 进行 处 理 。 某 个 应 用 的 要 求 就 是 需要 把 全 部 数据 处 理 一 遍 。 通 过 遍历 操作 可 使 二 又 
树 中 结 点 的 非 线性 关系 变 为 线性 序列 ,也 就 是 说 遍历 操作 使 非 线性 结构 线性 化 。 

把 一 棵 二 叉 树 理解 为 一 个 梯形 ,由 3 部 分 构成 : 圆 为 二 叉 树 的 根 , 其 余 左 子 树 和 右 子 树 
还 是 一 个 梯形 ,它们 依然 是 二 叉 树 ,所 以 整体 梯形 的 遍历 方法 可 以 继续 用 在 两 个 小 的 梯形 
上 ,当然 每 一 个 梯形 还 是 递归 地 遍历 下 去 ,直到 全 部 数据 都 被 访问 到 。 因 此 ,只 要 设法 遍历 
完 这 3 部 分 ,就 可 以 遍历 整个 二 叉 树 。 

车 以 Data、L、R 分 别 表示 访问 根 结 点 、 遍 历 根 结 点 的 左 子 树 .遍历 根 结 点 的 右 子 树 , 则 
二 叉 树 的 遍历 方式 有 六 种 : Data L R、L Data R、L R Data、Data RL、R DatalL 和 RL Data。 
因为 左右 关系 的 相对 位 置 对 于 遍历 的 原理 没有 影响 ,所 以 通常 只 讨论 前 3 种 方式 ,根据 根 在 
其 中 的 访问 次 序 , 定 义 为 : Data L R( 先 根 遍 历 ) 、L Data R( 中 根 遍历 ) 和 LL R Data( 后 根 遍历 ) 
(有 了 时 分 别称 为 “ 先 序 遍 历 “ 中 序 遍 历 “ 后 序 遍 历 " 等 )。 以 下 为 3 种 递归 遍历 算法 的 描述 。 

@ DLR( 先 根 遍历 )。 若 二 叉 树 为 空 ,遍历 结束 ; 否则 , 先 访 问 根 结 点 ; 然后 先 根 遍 历 根 
结 点 的 左 子 树 ; 青 先 根 遍 历 根 结 点 的 右 子 树 。 

@ LDR( 中 根 遍 历 )。 若 二 叉 树 为 空 ,遍历 结束 ; 否则 ,先进 行 中 根 人 遍历 根 结 点 的 左 子 
树 ; 再 访问 根 结 点 ; 再 中 根 遍 历 根 结 点 的 右 子 树 。 

@ LRD( 后 根 遍历 )。 车 二 叉 树 为 空 ,遍历 结束 ; 否则 ,先进 行 后 根 遍 历 根 结 点 的 左 子 
树 ; 再 后 根 遍历 根 结 点 的 右 子 树 ; 再 访问 根 结 点 。 

在 进行 遍历 时 ,要 注意 每 一 次 数据 被 访问 的 时 候 都 是 因为 这 个 数据 是 根 , 如 果 仅 仅 是 因 
为 左 儿 子 或 右 儿子 就 开始 访问 则 遍历 的 思路 已 经 出 错 。 结 点 没有 某 个 儿子 的 情况 下 将 视 为 
该 儿子 被 访问 完毕 ,这 也 是 程序 中 每 一 次 递归 开始 回溯 的 条 件 。 

图 8-14 为 二 叉 树 的 3 种 根 序 遍 历 示意 图 。 


© 
先 根 DLR (5) (©) (a,b,d,c,e,f) 
() 中 根 LDR (d) Ce) (bd,a,e,f,c) 
A [a 后 根 LRD CD (db.fe.c.a) 
(a) 二 又 树 递归 模型 (b) 3 种 遍历 的 次 序 (©) 二 又 树 范例 (d) 3 种 遍历 结果 


图 8-14 根 序 遍 历 示 意图 
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为 了 编写 更 通用 的 遍历 程序 ,把 对 结 点 的 访问 用 visit 函数 单独 表示 。 

下 面 是 二 叉 树 显示 结 点 数据 以 及 先 根 递归 遍历 的 源码 。 

先 根 的 函数 名 约定 为 : preorder; 中 根 的 函数 名 约定 为 inorder; 后 根 的 函数 名 约定 为 
postorder。 其 中 的 语句 次 序 按照 上 述 的 原则 稍 作 调整 即 可 。 


returninfo btree: :preorder (node * searchp) // 先 根 递归 遍历 
{ 


if(firstbracket == 1) // 处 理 显示 第 一 个 括号 
{ 

searchp = root; 

if(searchp == NULL) 


return underflow; 


firstbracket = 0; // 此 后 都 不 是 第 一 个 括号 了 
countnow = getcount( ); // 本 函数 中 使 用 结 点 个 数 
cout <<" 递 归 先 根 遍历 结果 : ("; 


if(searchp!= NULL) 
{ 
visit(searchp); 
Countnow ——; 
if(countnow!= 0) 
cout <<","; 
else 
cout <<")"<< endl; 
preorder( searchp -> lchild); 
preorder( searchp -> rchild); 
} 
return success; 


由 于 线性 表 输 出 的 设计 中 需要 把 括号 和 逗号 考虑 进去 ,那么 上 面 的 源码 略 显 繁杂 ,如 果 
不 需要 考虑 括号 和 逗号 的 设计 细节 问题 , 则 可 以 抽象 成 下 面 的 版 本 。 


returnInfo preorder(node * searchp) // 先 根 递 归 遍 历 
{ 


if( searchp!= NULL) 

{ 

visit(searchp); 

preorder( searchp— > 1Child); 
preorder(searchp — > rChild); 
} 


return success; 


} 
图 8-15 为 二 又 树 常用 功能 递归 根 序 遍历 图 。 
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法 : 默认 广义 表 
A 
仅仅 要 


点 信息 
司 时 显示 二 又 树 


8-15 二 叉 树 常用 功能 递归 根 序 遍 历 图 


8.6.2 根 序 遍 历 的 非 递归 算法 实现 


8. 6.1 节 中 的 根 序 遍 历 是 递归 的 , 故 采 用 递归 算法 书写 也 很 简洁 ,但 是 并 非 所 有 程序 设 
计 语 言 都 允许 递归 。 递 归程 序 虽 然 简洁 ,但 执行 中 需要 启用 栈 管理 返回 点 ,需要 付出 时 间 代 
价 。 下 面 讨论 如 何 用 非 递归 算法 实现 根 序 遍历 。 

对 于 二 又 树 ,对 其 进行 先 根 . 中 根 和 后 根 遍 历 都 是 从 根 结 点 开始 的 , 且 在 遍历 过 程 中 经 
过 结 点 的 路 线 是 一 样 的 ,只 是 访问 结 点 的 时 机 不 同 而 已 。 先 根 遍 历 是 在 深入 时 遇 到 结 点 就 
访问 ,中 根 遍 历 是 在 从 左 子 树 返 回 时 遇 到 结 点 访问 ,后 根 遍 历 是 在 从 右 子 树 返回 时 遇 到 结 点 
访问 。 在 这 一 过 程 中 ,返回 结 点 的 顺序 与 深入 结 点 的 顺序 相反 , 即 后 深入 先 返 回 ,这 正好 符 
合 栈 后 进 先 出 的 特点 。 因 此 可 用 栈 来 实现 这 一 遍历 路 线 。 其 过 程 如 下 : 在 沿 左 子 树 深入 
时 ,深入 一 个 结 点 和 人 栈 一 个 结 点 , 若 为 先 根 遍 历 , 则 在 入 栈 之 前 访问 ; 当 沿 左 分 枝 深入 不 下 
去 时 , 则 返回 , 即 从 堆栈 中 弹出 前 面 压 和 的 结 点 。 若 为 中 根 遍 历 , 则 此 时 访问 该 结 点 ,然后 从 
该 结 点 的 右 子 树 继续 深入 。 若 为 后 根 遍历 , 则 将 此 结 点 青 次 入 栈 ,然后 从 该 结 点 的 右 子 树 继 
续 深 入 ,与 前 面 类 同 , 仍 为 深入 一 个 结 点 人 栈 一 个 结 点 ,深入 不 下 去 再 返回 ,直到 第 二 次 从 栈 
里 弹出 该 结 点 , 才 访 问 。 

先 根 遍 历 的 非 递 归 实 现 。 在 下 面 算法 中 ,二 又 树 以 二 又 链表 存放 , 一 维 数组 
stack[Maxsize] 用 以 实现 栈 , 变 量 top 用 来 表示 当前 栈 项 的 位 置 。 为 了 把 二 又 树 遍 历 的 结果 
以 线性 表 的 形式 表示 出 来 ,其 中 使 用 了 统计 二 又 树 个 数 的 功能 ,用 以 实现 在 最 前 面 和 最 后 面 
显示 左右 括号 ,而 在 中 间 的 数据 之 间 用 逗号 分 隔 。 

在 遍历 输出 的 过 程 中 ,如 果 需 要 以 线性 表 的 逻辑 结构 形式 显示 , 即 把 括号 和 逗号 也 显示 
出 来 ,将 会 启用 一 个 计数 器 btreecount 来 管理 。 

returninfo btree: :nrpreorder(node * searchp) // 非 递归 先 根 遍历 


{ 
node * stack[Maxsize], * pnow; // 启 用 栈 , pnow 指向 二 叉 树 某 个 结 点 的 地 址 
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int top; 
searchp = root; 
if(searchp == NULL) 
return underflow; 
top= 0; //0 号 地 址 启用 存 人 第 一 个 数据 
pnow = searchp; 
cout <<" 非 递归 先 根 遍历 结果 : ("; 
countnow = getcount() 7 
while(! (pnow == NULL&&top == 0)) 


{ 
while( pnow!= NULL) 
{ 
visit(pnow); 
countnow ——; 
if(countnow!= 0) 
Cout <<","; 
else 
cout <<")"; 
if(top<Maxsize— 1) // 简 单 处 理 了 一 下 栈 的 溢出 问题 
{ 
stack[ top] = pnow; 
topt+; 
} 
else 
{ 
return overflow; 
} 
pnow= pnow — > lchild; 
} 
if(top<= 0) return success; 
else 
{ 
top——; 
pnow = stack[ top]; 
pnow= pnow 一 > rchild; 
} 
' 
cout << endl; 


return success; 

} 

中 根 遍 历 的 非 递 归 实 现 。 只 需 将 先 根 遍历 的 非 递 归 算 法 中 的 visit(pnow) 移 到 pnow 一 
stack[top] 和 pnow 王 pnow 一 > rchild 之 间 即 可 。 函 数 名 部 分 相应 改 为 void btree: : nrinorder 
(node * searchp) 。 

后 根 遍历 的 非 递 归 实 现 。 必 须 先 把 两 个 儿子 都 访问 完毕 , 才 可 以 访问 “ 根 ”, 为 了 保留 返 
回 地 址 ,所 以 必然 进 栈 两 次 。 并 不 是 任何 结 点 总 有 两 个 儿子 ,所 以 无 法 准确 判断 当前 栈 顶 是 
左 儿 子 还 是 右 儿子 ,解决 的 方法 有 两 种 : 四 启用 两 个 栈 ,分 别处 理 。 四 约定 结 点 要 和 人 两 次 
栈 ,出 两 次 栈 , 而 访问 结 点 是 在 第 二 次 出 栈 时 访问 。 因 此 ,为 了 区 别 同一 个 结 点 指针 的 两 次 
出 栈 ,设置 一 标志 flag, 令 ,flag 一 1 代表 第 一 次 出 栈 , 结 点 不 能 访问 ,flag 一 2 代表 第 二 次 出 
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栈 , 结 点 可 以 访问 , 当 结 点 指针 进出 栈 时 ,其 标志 flag 也 同时 进出 栈 。 因 此 ,可 将 栈 中 元 素 
的 数据 类 型 定义 为 指针 link 和 标志 flag 合并 。 定 义 如 下 : 


class stackdata // 创 建 一 个 stackdata 类 ,在 非 递归 遍历 算法 中 需要 
{ 
friend class btree; 
private: 
node * link; 
int flag; 
}; 


后 根 遍历 二 叉 树 的 非 递 归 算 法 如 下 。 在 算法 中 ,一 维 数 组 stackLMAXNUMJ 用 于 实现 
栈 的 结构 ,指针 变量 pnow 指向 当前 要 处 理 的 结 点 , 整 型 变量 top 用 来 表示 当前 栈 顶 的 位 
置 , 整 型 变量 sign 为 结 点 pnow 的 标志 量 。 


returninfo btree: :nrpostorder(node * searchp) // 非 递归 后 根 遍历 
{ 

stackdata stack[Maxsize]; // 此 处 的 栈 不 是 仅仅 存 指针 一 个 信息 ,而 是 多 个 信息 

node * pnow; 

int top, sign; 

searchp = root; 

if(searchp == NULL) 

return underflow; 

top= -1; 

Ppnow = searchp; 

cout <<" 非 递归 后 根 遍 历 结 果 : ("; 


countnow = getcount(); 


while(! (pnow== NULL&&top == — 1)) 
if(pnow!= NULL) 
{ 
if(top< Maxsize— 1) 
{ 
top++ 7 
stack[ top]. link = pnow; 
stack[top]. flag= 1; 
pnow = pnow — > lchild; 
} 
else 
return overflow; 
$ 
else 
{ 


pnow = stack[ top]. link; 
sign = stack[ top]. flag; 
top——; 
if(sign==1) 
{ 

topt+; 

stack[ top]. link = pnow; 
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stack[top]. flag= 2; 
pnow = pnow — > rchild; 


else 


Countnow ——; 
visit(pnow); 
if(countnow!= 0) 
Cout <<","; 
else 
cout <<")"; 
pnow = NULL; 


} 
} 
cout << endl; 


return success; 
} 
图 8-16 为 二 又 树 常用 功能 非 递归 根 序 遍 历 图 。 


EE es 
二 叉 树 竹 表 存储 功能 演示 | 


人 经 点 以 及 叶子 信息 
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图 8-16 二 叉 树 常用 功能 非 递归 根 序 遍历 图 


8.7 二 叉 树 的 层次 人 遍历 
二 叉 树 的 层次 遍历 是 指 从 二 又 树 的 第 一 层 ( 根 结 点 ) 开 始 , 从 上 至 下 逐 层 遍历 ,在 同一 层 
中 , 则 按 从 左 到 右 的 顺序 对 结 点 逐个 访问 。 


图 8-17 为 层次 遍历 的 示意 图 ,可 以 看 到 遍历 过 程 不 是 递归 的 。 理 解 这 个 算法 比 根 序 简 
单 ,但 是 在 算法 设计 上 有 一 定 的 难度 ,如 从 结 点 < 到 结 点 d 之 间 如 何 到 达 , 随 着 层次 的 增加 ， 
这 种 问题 是 无 法 用 一 般 程序 设计 技巧 解决 的 。 


直觉 上 很 难 发 现 其 运行 的 逻辑 关系 或 运行 规律 ,但 是 计算 机 科学 家 们 通过 启用 数据 结 
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构 队 列 给 出 了 一 个 简洁 解决 方案 。 算 法 为 从 根 开 始 , 不 直接 访问 ,而 是 首先 进入 队列 ,之 后 

循环 判断 。 当 队列 不 为 空 时 ,把 队 头 出 队 , 同 时 访问 , 另 Q 

外 把 它 存在 的 左 儿 子 和 右 儿 子 依次 进 队 ,直到 最 后 队列 

为 空 G © 
在 下 面 的 层次 遍历 算法 中 ,二 叉 树 以 二 又 链表 存放 ， (多 

一 维 数组 queue[Maxsize] 用 以 实现 队列 ,变量 front 和 (9) 

rear 分 别 表示 当前 队 首 元 素 和 队 尾 元 素 在 数组 中 的 图 8-17 层次 遍历 示意 图 

位 置 。 


(ab,d,c,e,f) 


returninfo btree: :levelorder(node * searchp) // 层 次 遍历 
{ 
node * queue[Maxsize]; // 本 队列 操作 没有 考虑 假 溢出 问题 
int front, rear; // 队 头 和 队 尾 
searchp = root; // 处 理 空 二 叉 树 


if(searchp == NULL) 


return underflow; 


countnow = getcount( ); // 本 函数 中 使 用 结 点 个 数 
front= —1; // 队 列 指针 初始 化 
rear=0; 
queue[ rear] = searchp; // 把 根 结 点 入 队 


cout <<" 层 次 遍历 结果 : ("; 
while(front!= rear) 


{ 


front++; 
visit(queue[ front]); // 访 问 队 首 元 素 的 数据 
countnow —— ; // 本 次 处 理 减少 一 个 已 经 被 访问 的 数据 
if(countnow!= 0) // 数 据 没 有 完 输出 逗号 
cout <<","; 
else 
cout <<")"; // 数 据 结束 时 输出 右 括号 
if(queue[ front] -> lchild!= NULL) // 将 队 头 数据 的 左 儿 子 入 队 
{ 
reartt+; 


queue[ rear] = queue[ front] -> lchild; 
if(queue[ front] -> rchild!= NULL) // 将 队 头 数据 的 右 儿 子 入 队 
{ 

reart+; 


queue[ rear] = queue[front] -> rchild; 
} 


cout << endl; 


return success; 
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图 8-18 为 二 又 树 常用 功能 层次 遍历 图 。 


;世上 而 喇 各 | 于 内 吉 理 庆 类 天 和 
IE 


: Ca b- ho cs fi jd e.g) 
成 功 !. 


请 按 任意 键 继续 . 
| ; 


图 8-18 二 叉 树 常用 功能 层次 遍历 图 


8.8 线索 二 叉 树 


8.8.1 线索 二 又 树 的 定义 ,逻辑 结构 及 存储 结构 


一 个 具有 n 个 结 点 的 二 叉 树 车 采用 二 叉 链表 存储 结构 ,在 2Xn 个 指针 域 中 只 有 n 一 1 
个 指针 域 是 用 来 存储 结 点 儿子 的 地 址 ,而 男 外 n 十 1 个 指针 域 存放 的 都 是 空 指针 。 一 般 情 况 
下 二 叉 树 的 所 有 叶子 结 点 的 两 个 儿子 链 域 都 是 空 指针 ,其 他 的 结 点 如 果 只 有 一 个 儿子 的 也 
会 有 一 个 儿子 链 域 是 空 指针 ,那么 能 不 能 利用 这 些 空 指针 增加 一 些 其 他 信息 呢 ? 答案 是 肯 
定 的 。 本 节 讨 论 利 用 空 的 链 域 记 录 该 二 又 树 的 某 种 遍历 次 序 下 的 部 分 信息 。 

通过 某 种 遍历 可 以 把 二 又 树 中 所 有 非 线 性 关系 的 结 点 排列 为 一 个 线性 表 。 对 于 这 个 线 
性 表 ,希望 能 在 原来 的 二 又 树 中 利用 空 指针 记录 一 些 信息 ,下 次 遍历 时 就 可 以 更 快 地 达到 某 
个 结 点 。 对 于 这 些 空 指针 的 利用 , 称 为 “线索 ”(thread) ,它们 用 来 保留 结 点 在 某 种 遍历 序列 
中 直接 前 趋 和 直接 后 继 的 位 置信 息 ,而 加 了 线索 的 二 叉 树 称 为 线索 二 叉 树 。 
建立 二 叉 树 时 并 不 能 同时 建立 线索 ,只 能 在 对 二 叉 树 遍历 的 动态 过 程 中 得 到 这 些 信息 。 
由 于 序列 可 由 不 同 的 遍历 方法 得 到 ,因此 线索 树 有 先 根 线索 二 又 树 、 中 根 线 索 二 叉 树 和 后 根 
线索 二 叉 树 3 种 。 把 二 又 树 改造 成 线索 二 又 树 的 过 程 称 为 线索 化 。 

线性 关系 中 分 别 用 左右 关系 代表 直接 前 趋 和 直接 后 继 ,所 以 用 空 的 左 儿子 链 域 来 记录 
直接 前 趋 , 用 空 的 右 儿 子 链 域 来 记录 直接 后 继 。 如 果 原 来 的 儿子 指针 不 为 空 , 则 不 能 使 用 ， 
图 8-19 中 使 用 虚线 来 表示 线索 ,那么 在 编程 时 如 何 区 分 哪个 地 址 是 儿子 结 点 地 址 ,哪个 地 
址 是 线索 信息 呢 ? 为 了 区 分 两 个 标志 位 ,通过 0 和 1 的 区 别 就 知道 是 儿子 还 是 线索 ,这样 结 
点 就 演变 为 五 个 域 ( 另 外 一 个 思路 是 不 改变 结 点 结构 , 仅 在 作为 线索 的 地 址 前 加 负 号 , 即 负 
地 址 表示 线索 , 正 地 址 表示 儿子 指针 ) 。 这 样 的 数据 结构 改造 也 是 通过 增加 空间 的 代价 来 换 
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取 提 高 速度 的 范例 。 
线索 二 又 树 的 二 又 链表 的 结 点 对 象 表 示 可 描述 为 : 


class threadnode 
{ 
char data; 
int ltag, rtag; 
threadnode * lchild, * rchild; 
}; 
图 8-19 为 中 序 遍历 线索 二 又 树 的 示意 图 。 左 边 给 出 了 结 点 构造 ,共有 5 个 域 ,分 别 为 
左 链 域 . 左 标志 位 、 数 据 域 . 右 标志 位 、 右 链 域 ,并 且 给 出 了 右边 图 中 字符 c 的 实际 存储 效果 。 
实际 儿子 采用 实 线 标志 ,线索 采用 虚线 标注 。 其 中 : 
ltag 一 0 代表 指针 指向 左 儿 子 结 点 ,ltag 一 1 代表 指针 指向 其 前 趋 结 点 ， 
rtag 一 0 代表 指针 指向 右 儿子 结 点 ,rtag 二 1 代表 指针 指向 其 后 继 结 点 。 


lchild | ltag | data | rtag | rchild 


一 一 0 C 1 、、 
~ 
> 


(a) 结 点 设计 和 结 点 数据 实例 (b) 线索 二 叉 树 的 逻辑 结构 
图 8-19 ”中 序 遍 历 线索 二 又 树 的 示意 图 


8.8.2 线索 二 又 树 的 算法 设计 


下 面 以 中 根 线 索 二 又 树 为 例 , 讨 论 线索 二 叉 树 的 建立 、 线 索 二 叉 树 的 遍历 。 

由 于 8. 8.1 节 中 二 又 树 的 构建 使 用 了 广义 表 和 逐个 符号 输入 法 ,本 节 采 用 二 又 树 先 序 
遍历 后 的 一 种 字符 串 格式 ,约定 儿子 为 空 的 情况 用 表示, 则 图 8-14 涉及 的 结 点 按照 先 根 
遍历 的 思路 提供 的 字符 串 如 下 : 


char defaultbtree[ ] = "ab 提 d 间 间 ce##f 打 提 提 " 


首先 把 字符 串 依然 按照 先 根 遍 历 的 递归 算法 构建 二 又 树 ,然后 开始 线索 化 。 

对 二 又 树 线索 化 实质 上 就 是 遍历 一 棵 二 又 树 的 同时 增加 线索 信息 。 在 遍历 过 程 中 , 访 
问 结 点 的 操作 是 检查 当前 结 点 的 左 \ 右 指针 域 是 否 为 空 ,如 果 为 空 , 则 将 它们 改 为 指向 前 趋 
结 点 或 后 继 结 点 的 线索 。 

此 处 为 中 根 线索 化 , 故 对 先 根 遍 历 建立 的 二 叉 树 进行 中 根 遍 历 同时 增加 线索 即 可 。 

为 了 体现 线索 二 叉 树 的 优点 ,同时 提高 了 根 序 的 3 种 遍历 。 可 以 通过 对 比 上 面 讨论 过 
的 3 种 递归 遍历 和 3 种 非 递归 遍历 看 到 ,这 里 的 3 种 遍历 都 没有 用 到 递归 或 数据 结构 栈 。 
尤其 是 中 根 遍历 ,演变 成 一 段 相当 简洁 的 程序 代码 。 

为 了 提高 程序 的 健壮 性 ,建议 增设 一 个 头 结 点 ,数据 域 不 存放 信息 ,其 左 指针 域 指向 二 
叉 树 的 根 结 点 , 右 指针 域 指向 自己 。 原 二 又 树 在 某 种 次 序 遍历 下 的 第 一 个 结 点 的 直接 前 趋 
线索 和 最 后 一 个 结 点 的 直接 后 继 线索 都 指向 该 头 结 点 。 读 者 可 以 自行 增加 。 
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【程序 源码 8-2】 中 根 线索 二 又 树 的 建立 和 遍历 源 程序 。 
// 线 索 二 叉 树 的 功能 展示 


# include< windows.h> 

# include < iostream> 

# include < iomanip > 

# include < sstream> // 提 供 stringstrean 的 功能 

using namespace std; 

enum returninfo {success, fail, overflow, underflow, nolchild, norchild, nofather, havesonl, 
havesonr, haveason, havetwosons, range_error, quit 


}; // 定 义 返回 信息 清单 
# define Maxsize 100 // 定 义 的 长 度 
char defaultbtree[ ] = "ab#d 并 提 ce 打 开间 失 "; // 默 认 先 根 遍历 的 输入 数据 
bool startbuild; // 标 记 是 否 是 新 建 二 叉 树 ,为 0 时 是 
// 新 建 ,为 1 则 已 经 建立 

class threadnode 
{ 
public: 

char data; 


int ltag, rtag; 
threadnode * lchild, * rchild; 
threadnode( const char item) :data( item), lchild( NULL), rchild(NULL), 
ltag(0), rtag(0) {} 
}; 
class threadtree 
{ 
private: 
char btreedata[ Maxsize]; 
// 存 储 先 根 遍 历 下 约定 的 字符 串 形式 用 于 构建 二 叉 树 


char answer; 


stringstream buff; // 用 于 输入 字符 串 
protected: 

threadnode * root; 

void creatbtree( threadnode * &nodenow); // 递 归 建 立 二 叉 树 

void buildinorderthread(threadnode * current,threadnode * &pre); 

// 建 立 中 根 线索 

threadnode * parent(threadnode * nodenow); // 查 找 父亲 结 点 

public: 


threadtree() {}; 
一 threadtree() {}; 


returninfo inputbtree( int choice); // 输 入 数据 : 两 种 ; 1: 默认 2: 键盘 
// 输 入 
void showbtreedata( ); // 在 主 界面 中 显示 当前 工作 数组 
threadnode * first(threadnode * current); // 找 中 根 序列 下 的 第 一 个 
threadnode * last(threadnode * current); // 找 中 根 序列 下 的 最 后 一 个 
threadnode * prior(threadnode x current); // 找 中 根 序列 下 的 上 一 个 
threadnode * next(threadnode * current); // 找 中 根 序列 下 的 下 一 个 
returninfo buildinorderthread( ); // 构 建 中 根 线索 二 叉 树 的 入 口 


void preorder(void ( * visit) (threadnode x searchp)); // 线 索 二 叉 树 下 的 先 根 遍历 
void inorder (void ( * vis 让 ) (threadnode * searchp)); // 线 索 二 叉 树 下 的 中 根 遍历 
void postorder(void ( * visit) (threadnode * searchp) ); // 线 索 二 叉 树 下 的 后 根 遍 历 
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}; 

// 通 过 中 根 递归 遍历 ,对 二 叉 树 进行 线索 化 

void threadtree: :buildinorderthread(threadnode * current, threadnode * &pre) 
{ 


if(current == NULL) return; 


buildinorderthread(current -> lchild, pre); // 递 归 访 问 左 子 树 
if(current -> lchild == NULL) // 没 有 左 儿子 则 开始 做 左 线索 
current 一 > lchild = pre; 
current 一 > ltag = 1; 
} 
if(pre!= NULL && pre—> rchild == NULL) // 没 有 右 儿 子 则 开始 做 右 线索 
{ 
pre 一 > rchild = current; 
pre->rtag = 1; 
} 
pre = current; 
buildinorderthread(current 一 > rchild, pre); // 递 归 访问 右 子 树 


// 在 中 根 线索 二 叉 树 上 实现 先 根 遍 历 
void threadtree: :preorder (void( * visit) (threadnode * searchp)) 
{ 

threadnode * searchp= root; 

while( searchp!= NULL) 

{ 


visit(searchp); // 访 问 根 结 点 
if(searchp->ltag == 0) // 有 左 子女 , 即 为 后 继 
searchp = searchp 一 > lchild; 
else if(searchp—> rtag == 0) // 有 右 子女 , 即 为 后 继 
searchp = searchp ->rchild; 
else 
{ 
while (searchp!= NULL && searchp -> rtag == 1) // 沿 后 继 线索 检测 
searchp = searchp 一 > rchild; // 直 到 有 右 子 女 的 结 点 
if (searchp!= NULL) // 此 时 必 有 rtag=0 
searchp = searchp 一 > rchild; // 右 子女 即 为 后 继 


} 
上 
// 在 中 根 线索 二 叉 树 上 实现 中 根 遍 历 
void threadtree: : inorder(void( * visit)(threadnode * searchp)) 
{ 
threadnode * searchp; 
for(searchp = first(root); searchp != NULL; searchp = next(searchp)) 
visit(searchp); // 由 于 线索 树 为 中 根 ,所 以 中 根 遍 
// 历 就 很 简单 
} 
// 在 中 根 线索 二 又 树 上 实现 后 根 遍 历法 
void threadtree: :postorder (void( * visit)(threadnode * searchp)) 
{ 
threadnode x workingp, * searchp; 
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workingp = root; // 使 用 工作 指针 workingp, 从 根 结 点 
// 开 始 
while(workingp 一 > ltag == 0 || workingp ->rtag ==0) // 有 左右 儿子 时 , 往 儿子 结 点 上 移动 
{ 
if(workingp—> ltag == 0) 
workingp = workingp—> lchild; 
else 
if(workingp -> rtag == 0) 
workingp = workingp—> rchild; 
} 


visit(workingp); // 访 问 当前 工作 指针 所 指 结 点 
while( (searchp = parent (workingp)) != NULL) // 使 用 搜索 指针 searchp, 每 次 从 工 
// 作 指针 父 结 点 开始 


{ 
if(searchp -> rchild == workingp || searchp->zrtag == 1) 
workingp = searchp; 
else 
{ 
workingp = searchp 一 > rchild; 
while(workingp -> ltag == 0 || workingp -> rtag == 0) 
{ 
if(workingp—> ltag == 0) workingp = workingp 一 > lchild; 
else if(workingp—> rtag == 0) workingp = workingp 一 > rchild; 
} 
} 
visit(workingp); // 访 问 当前 工作 指针 所 指 结 点 


} 


关于 线索 树 的 其 他 程序 设计 ,可 以 参照 以 上 的 讨论 进行 。 
图 8-20 为 线索 二 叉 树 常用 功能 图 。 


当 衣 二 又 树 的 
村 1 


de 


8-20 ”线索 二 又 树 常用 功能 图 


8.9 最 优 二 又 树 


本 节 把 二 又 树 作为 解决 实际 问题 的 工具 ,通过 案例 进一步 了 解 二 叉 树 的 作用 。 
最 优 二 又 树 ( 哈 夫 曼 树 ) 给 定 一 组 权 值 ,把 它们 作为 一 个 二 叉 树 的 叶子 结 点 ,可 以 构造 出 
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无 数 个 不 同 的 带 权 二 又 树 。 在 前 面 介绍 过 路 径 和 结 点 的 路 径 长 度 的 概念 ,而 二 叉 树 的 路 径 
长 度 则 是 指 由 根 结 点 到 所 有 叶 结 点 的 路 径 长 度 之 和 。 如 果 二 叉 树 中 的 叶 结 点 都 具有 一 定 的 
权 值 , 则 可 将 这 一 概念 加 以 推广 。 

设 二 叉 树 具有 n 个 带 权 值 的 叶 结 点 ,那么 从 根 结 点 到 各 个 叶 结 点 的 路 径 长 度 与 相应 结 
点 权 值 的 乘积 之 和 叫做 二 叉 树 的 带 权 路 径 长 度 , 记 为 : 


WPL = DB) Wx Ls 
k=1 


其 中 ,Wi 为 第 k 个 叶 结 点 的 权 值 ; Li 为 第 k 个 叶 结 点 的 路 径 长 度 。 

例如 ,给 出 4 个 叶 结 点 , 设 其 权 值 分 别 为 1,3,5,7, 下 面 可 以 给 出 形状 不 同 的 多 个 二 叉 
树 。 这 些 形状 不 同 的 二 又 树 的 带 权 路 径 长 度 显然 各 不 相同 ,而 哪 一 棵 是 最 小 带 权 路 径 长 度 
的 二 叉 树 呢 ? 

图 8-21 为 多 种 带 权 二 又 树 的 范例 。 通 过 第 4 棵 二 又 树 能 想到 ,可 以 画 出 无 数 个 以 1、3、 
5、7 为 叶子 结 点 的 二 叉 树 ,以 下 为 分 别 计算 出 的 带 权 路 径 长 度 值 。 

(1) WPL=1X2 十 3X2 十 5X2 十 7X2 一 32 

(2) WPL=1X3 十 3X3 十 5X2 十 7X1 一 29 

(3) WPL=1X2 十 3X3 十 5X3 十 7X1 一 33 

(4) WPL=1X3 十 3X1 二 5X3 十 7X3 一 42 


(1) CO) 
图 8-21 以 1、3、5、7 为 叶子 结 点 的 二 叉 树 4 种 范例 


最 优 二 又 树 ,又 称 哈 夫 曼 (Haffman) 树 ,是 指 一 组 带 有 确定 权 值 的 叶 结 点 ,构造 出 具有 
最 小 带 权 路 径 长 度 的 二 叉 树 。 

程序 设计 中 通常 使 用 穷 举 法 来 搜索 正确 结果 ,此 处 就 是 把 所 有 符合 条 件 的 二 叉 树 全 部 
求 出 来 ,然后 求 出 所 有 的 带 权 路 径 长 度 , 青 求 出 其 最 小 值 ,其 对 应 的 二 又 树 就 是 那 棵 二 叉 树 。 
但 是 这 样 显然 不 可 行 , 除 了 要 付出 巨大 的 时 间 、 空 间 代价 ,这 种 二 叉 树 的 个 数 也 无 限 多 ,而 其 
权 位 置 的 排列 不 同 又 会 产生 大 量 不 同 的 带 权 路 径 长 度 。 

此 处 只 能 使 用 构造 法 ,就 是 设法 构造 一 棵 二 叉 树 ,使 得 它 的 带 权 路 径 长 度 达 到 最 小 ,这 
样 也 就 达到 了 求 最 小 带 权 路 径 长 度 的 目标 。 

根据 哈 夫 曼 树 的 定义 ,一 棵 二 又 树 要 使 其 WPL 值 最 小 ,必须 使 权 值 越 大 的 叶 结 点 越 靠 
近 根 结 点 ,而 权 值 越 小 的 叶 结 点 越 远 离 根 结 点 。 

哈 夫 曼 (Haffman) 依 据 这 一 特点 提出 了 一 种 算法 ,这 种 方法 的 基本 思想 是 : 

(1) 由 给 定 的 n 个 权 值 {Wi ,Ws,…,W} 构 造 n 棵 只 有 一 个 叶 结 点 的 二 叉 树 ,从 而 得 到 
一 个 二 又 树 的 集合 F= {Ti ,Ts,…,T,}。 

(2) 对 下 进行 排序 ,从 小 到 大 排列 。 
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(3) 选取 下 中 当前 第 一 棵 和 第 二 棵 二 叉 树 ( 即 最 小 值 和 次 小 值 ) ,并 且 从 下 中 删除 ,分 别 
作为 左 、 右 子 树 构造 一 棵 新 的 二 叉 树 , 根 结 点 的 权 值 是 它们 的 权 值 之 和 ,然后 把 这 个 新 值 作 
为 新 的 二 叉 树 插入 到 下 的 正确 位 置 上 , 即 保持 从 小 到 大 排列 。 

(4) 重复 (3) ,当下 中 只 剩 下 一 棵 二 叉 树 时 ,这 棵 二 又 树 便 是 所 要 建立 的 哈 夫 曼 树 。 

图 8-22 给 出 了 前 面 提 到 的 叶 结 点 权 值 集合 为 W=={1,3,5,7} 的 喻 夫 曼 树 的 构造 过 程 。 
可 以 计算 出 其 带 权 路 径 长 度 为 29。 通 过 对 比 , 上 述 二 叉 树 中 也 有 一 个 带 权 路 径 长 度 为 29 
的 ,但 是 那个 是 偶然 产生 的 ,这 是 通过 规律 产生 的 。 


© 
OOOO OO 
WY ©) oO 
(1) (2) G) 

图 8-22 哈 夫 曼 树 的 建立 过 程 示 意图 


对 于 同一 组 给 定 叶 结 点 所 构造 的 哈 夫 曼 树 ,由 于 左右 儿子 的 位 置 可 能 不 同 , 最 后 二 又 树 

的 形状 可 能 不 同 , 但 带 权 路 径 长 度 值 是 相同 的 ,一定 是 最 小 的 。 
WPL=7X1+1X3+3X3+5X2=29 

在 构造 哈 夫 曼 树 时 ,可 以 设置 一 个 数组 HuffNode 保存 哈 夫 曼 树 中 各 结 点 的 信息 ,根据 
二 叉 树 的 性 质 可 知 ,具有 n 个 叶子 结 点 的 哈 夫 曼 树 共有 2Xn 一 1 个 结 点 ,所 以 数组 
HuffNode 的 大 小 设置 为 2Xn 一 1, 其 中 ,weight 域 保 存 结 点 的 权 值 ,Lechild 和 Rchild 域 分 
别 保存 该 结 点 的 左右 儿子 结 点 在 数组 HuffNode 中 的 序号 ,从 而 建立 起 结 点 之 间 的 关系 。 
为 了 判定 一 个 结 点 是 否 已 加 入 到 要 建立 的 哈 夫 曼 树 中 ,可 通过 father 域 的 值 来 确定 。 初 始 
时 father 的 值 为 一 1, 当 结 点 加 入 到 树 中 时 ,该 结 点 father 的 值 为 其 父亲 结 点 在 数组 
HuffNode 中 的 序号 ,不 再 是 一 1。 

构造 哈 夫 曼 树 时 ,首先 将 由 n 个 字符 形成 的 n 个 叶 结 点 存放 到 数组 HuffNode 的 前 n 
个 分 量 中 ,然后 根据 前 面 介绍 的 哈 夫 曼 方法 ,不 断 将 两 个 小 子 树 合并 为 一 个 较 大 的 子 树 ,每 
次 构成 的 新 子 树 的 根 结 点 顺序 放 到 HuffNode 数组 中 的 前 n 个 分 量 的 后 面 。 

下 面 讨论 最 优 二 又 树 在 判定 问题 中 的 应 用 。 在 多 分 支 程序 设计 中 ,通常 使 用 扫描 法 , 比 
如 要 把 一 批 学 生 的 百分制 考试 分 数 转换 成 五 级 分 制 。 一 般 情况 下 此 程序 的 设计 从 0 分 到 
60, 再 到 70、80、90, 最 后 到 100, 以 下 的 条 件 语句 就 是 主要 思路 。 如 : 


证 (mark< 60) grade= "不 及 格 "; 
else if (mark<70) grade= "及 格 " 
else if (mark<80) grade= "中" 
else if (mark<90) grade=" 良 " 
else grade = " 优 "; 
这 个 判定 过 程 没 有 考虑 考试 分 数 的 概率 分 布 ,实际 上 正常 情况 应 该 是 以 75 一 85 为 中 轴 
的 (近似 ) 正 态 分 布 ,所 以 大 量 的 数据 “堆积 ”在 76 一 85, 为 了 提高 程序 的 时 间 效 率 , 就 应 该 考 
虑 这 个 因素 。 比 如 某 批 分 数 的 分 布 规律 如 表 所 示 。 
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分 数 0~59 60~69 70~79 80~89 90 一 100 
概率 0.05 0.15 0.40 0.30 0.10 


则 80% 以 上 的 数据 需 进 行 3 次 或 3 次 以 上 的 比较 才能 得 出 结果 。 下 面 把 它们 的 概率 为 权 
构造 一 棵 有 5 个 叶子 结 点 的 哈 夫 曼 树 , 则 可 得 到 新 的 的 判定 过 程 , 它 可 使 大 部 分 的 数据 经 过 
较 少 的 比较 次 数 得 出 结果 。 在 数据 量 较 大 时 ,这 种 优化 后 的 模型 就 是 最 优 模型 。 

图 8-23 为 两 种 模型 的 对 比 , 可 以 看 出 经 过 理论 优化 后 的 流程 从 形式 上 看 有 些 难以 理 
解 , 但 是 时 间 效率 却 可 以 大 大 提高 。 这 就 是 理论 知识 和 数学 抽象 有 时 比 人 类 直觉 思维 更 好 
的 情况 。 


(a) 直觉 的 分 支 模型 (b) 根据 理论 优化 后 的 分 支 模型 
图 8-23 哈 夫 曼 树 在 判定 问题 中 的 应 用 示意 图 


下 面 讨 论 最 优 二 又 树 在 编码 问题 中 的 应 用 。 在 早期 的 电报 传输 中 ,有 一 种 电报 码 ,按照 
4 个 数字 对 应 一 个 汉字 的 关系 进行 转换 。 由 于 是 “等 长 编码 ”的 定 长 结构 ,所 以 可 以 连续 拍 
发 ,对 方 接 到 后 也 是 按照 每 四 位 进行 译 码 , 就 可 以 正常 使 用 ,但 是 这 种 编码 方式 没有 考虑 文 
字 使 用 频率 。 如 果 把 文字 使 用 频率 作为 一 个 因素 ,把 常用 汉字 进行 更 短 的 编码 ,而 不 大 常用 
的 即使 使 用 更 长 的 码 也 容许 ,只 要 能 保证 提高 了 传输 中 的 整体 时 间 效 率 即 可 ,这 就 是 所 谓 的 
“不 等 长 编码 ”。 但 是 码 长 不 相等 带 来 了 新 的 问题 , 那 就 是 如 何 正 确切 分 。 如 果 每 个 字符 之 
间 增 加 一 个 特别 的 符号 以 示 区 别 , 看 起 来 好 像 解 决 了 这 个 问题 ,但 实际 还 是 付出 了 很 大 的 传 
输 时 间 成 本 ,如 10 000 个 字符 就 要 增加 约 10 000 个 切 分 符 。 

问题 的 关键 是 能 否 找 到 一 种 方案 ,使 得 码 长 不 相等 的 情况 下 并 不 需要 切 分 符 , 这 是 一 件 
并 不 容易 做 到 的 事情 。 如 果 由 人 来 设计 ,首先 是 如 何 解 决 冲突 的 问题 : 如 A 为 001,B 为 0， 
C 为 1,D 为 01。 在 译 码 0001 的 时 候 , 就 可 能 是 BA、BBBC、BBD 等 多 种 结果 ,这 显然 是 不 可 
行 的 ,即使 赁 着 直觉 设 计 了 一 套 没有 歧义 的 方案 ,但 面 对 几 千 个 汉字 的 编码 设计 ,如 何 设计 
以 确保 不 会 出 现 歧义 编码 体系 呢 ? 可 以 想象 其 工作 量 之 大 ,以 及 其 结果 并 不 一 定 更 优化 ,所 
以 必须 推出 一 种 算法 ,由 计算 机 自动 生成 所 有 编码 ,的 确 是 不 等 长 和 不 需要 附加 切 分 符 的 。 
这 种 优化 的 编码 方式 可 以 由 最 优 二 叉 树 来 解决 ,通过 这 个 案例 可 以 体会 到 数据 结构 的 作用 。 

在 数据 通信 中 ,需要 将 传送 的 文字 转换 成 由 二 进 制 字符 0、1 组 成 的 二 进 制 串 , 称 为 编 
码 。 下 面 是 用 最 优 二 又 树 来 构造 使 电文 的 编码 总 长 最 短 的 编码 方案 。 

具体 做 法 如 下 : 设 需要 编码 的 字符 集合 为 {di ,ds ,…,d,) ,它们 在 电文 中 出 现 的 次 数 或 
频率 集合 为 {wi ,wz wa) ;以 ,ds，… ,ds 作为 叶 结 点 ,wi ,ws，,… ,ws 作为 它们 的 权 值 ， 
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构造 一 棵 哈 夫 曼 树 ,规定 哈 夫 曼 树 中 的 左 分 枝 代表 0 , 右 分 枝 代表 1, 则 从 根 结 点 到 每 个 叶 
结 点 所 经 过 的 路 径 分 枝 组 成 的 0 和 1 的 序列 便 为 该 结 点 对 应 字符 的 编码 , 称 为 哈 夫 曼 
编码 。 

在 哈 夫 曼 编 码 树 中 , 树 的 带 权 路 径 长 度 的 含义 是 ,各 个 字符 的 码 长 与 其 出 现 次 数 的 乘积 
之 和 ,也 就 是 电文 的 代码 总 长 , 故 采 用 哈 夫 曼 树 构造 的 编码 是 一 种 能 使 电文 编码 总 长 达到 最 
短 的 不 等 长 编码 体系 。 

在 建立 不 等 长 编码 时 ,必须 使 任何 一 个 字符 的 编码 都 不 是 男 一 个 字符 编码 的 前 级 ,这 样 
才能 保证 译 码 的 唯一 性 。 在 这 种 方案 中 ,每 一 个 编码 都 是 一 条 从 根 到 某 个 叶子 结 点 的 路 径 ， 
绝对 不 会 出 现 前 级 的 相同 ,从 而 保证 了 译 码 的 非 歧 义 性 。 

下 面 讨论 实现 哈 夫 曼 编码 的 算法 。 实 现 哈 夫 曼 编码 的 算法 可 分 为 两 大 部 分 : 

(1) 构造 哈 夫 曼 树 ; 

(2) 在 哈 夫 曼 树 上 求 叶 结 点 的 编码 。 

求 哈 夫 曼 编 码 ,实质 上 就 是 在 已 建立 的 哈 夫 曼 树 中 ,从 叶 结 点 开始 , 沿 结 点 的 父亲 链 域 
回 退 到 根 结 点 ,每 回 退 一 步 , 就 走 过 了 哈 夫 曼 树 的 一 个 分 枝 , 从 而 得 到 一 个 哈 夫 曼 码 值 ,由 于 
一 个 字符 的 哈 夫 曼 编码 是 从 根 结 点 到 相应 叶 结 点 所 经 过 的 路 径 上 各 分 枝 所 组 成 的 0,1 序 
列 , 因 此 先 得 到 的 分 枝 代 码 为 所 求 编码 的 低位 码 , 后 得 到 的 分 枝 代码 为 所 求 编码 的 高 位 码 。 
可 以 设置 一 结构 数组 HuffCode 用 来 存放 各 字符 的 哈 夫 曼 
编码 信息 ,数组 元 素 的 结构 如 下 ， 


bit start 


约定 分 量 bit 为 一 维 数组 ,用 来 保存 字符 的 哈 夫 曼 编 
码 ,start 表示 该 编码 在 数组 bit 中 的 开始 位 置 。 所 以 ,第 i 
个 字符 的 哈 夫 曼 编码 存放 在 HuffCode[ij. bit 中 的 从 
HuffCode[i]. start 到 n 的 分 量 上 。 

图 8-24 为 一 套 哈 夫 曼 编码 的 效果 示意 图 。 假 设 上 面 的 4 个 数字 为 4 个 字母 的 权 值 , 代 
表 它 们 的 使 用 频率 ,在 其 最 优 二 又 树 的 所 有 边 旁 写 出 相应 的 0 和 1, 按照 规则 写 出 的 编码 
为 : A: 100 B: 101 C:0 D: 11。 

下 面 是 一 个 译 码 的 范例 : 10000111011100001010000011 ,翻译 后 唯一 结果 是 : ACCDB 
DCCCCBCCCCCD. 

【程序 源码 8-3】〗 最 优 二 又 树 求 哈 夫 曼 编码 的 源码 如 下 : 


8-24 ”生成 哈 夫 曼 编码 的 
二 叉 树 示意 图 


# include "iostream. h" 

# include "stdlib. h" 

# include "windows. h" 

# include "time.h" 

const int MaxValue = 10000; 
const int MaxBit = 26; 
const int MaxN = 26; 

class HaffNode 

{ 

public: 
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int weight; 
int flag; 
int parent; 
int leftChild; 
int rightChild; 
}; 
class Code 
public: 
int bit[MaxN]; 
int start; 
int weight; 
}; 
class Haffmanuse 
{ 
public: 
void Haffman( int weight[ ], int n, HaffNode haffTree[ ]); 
void HaffmanCode( HaffNode haffTree[ ], int n, Code haffCode[ ]); 
void Showface( ); 
void Datadeal(); 
private: 
int size; 
intx data; 
}; 
void Haffmanuse: :Haffman( int weight[ ], int n, HaffNode haffTree[ ]) 
{ 
int j, maposl, mapos2, posl, pos2; 
//j 为 内 部 循环 变量 , posl 和 pos2 控制 下 标 
for(int i=0;i<2xn;it+) 
{ 
if(i<n) 
haffTree[ i].weight = weight[i]; 
else 
haffTree[ i].weight = 0; 
haffTree[ i]. parent = 0; 
haffTree[i].flag= 0; 
haffTree[i]. leftChild= —1; 
haffTree[i].rightChild= -1; 
for(i=0;i<nii++) 
{ 
maposl = mapos2 = MaxValue; 
posl = pos2=0; 
for(j=0;j<nt+i;j++) 
{ 
if(haffTree[j].weight < maposl && haffTree[j].flag== 0) 
{ 
mapos2 = maposl1; 
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pos2 = posl1; 

maposl = haffTree[ j]. weight; 

Posl=j; 
} 
else if(haffTree[j].weight < mapos2 && haffTree[j].flag == 0) 
{ 

mapos2 = haffTree[ j]. weight; 

pos2=j; 


} 

if(n+i == 2*x*n-1) break; 

haffTree[ posl].parent =n+ i; 

haffTree[ pos2]. parent =n+ i; 

haffTree[ pos1].flag=1; 

haffTree[ pos2]. flag= 1; 

haffTree[n + i].weight = haffTree[posl].weight + haffTree[ pos2]. weight; 
haffTree[n+ i].leftChild= posl; 

haffTree[n + i]. rightChild = pos2; 


} 
void Haffmanuse: :HaffmanCode( HaffNode haffTree[ ], int n, Code haffCode[ ]) 
{ 
Code * mycode = new Code; 
int child, parent; 
for(int i=0;i<n;it+) 
{ 
mycode -> start=n-1; 
mycode — > weight = haffTree[ i]. weight; 
child= i; 
parent = haffTree[ child]. parent; 
while(parent!= 0) 
{ 
if(haffTree[ parent]. leftChild== child) 
mycode ->bit[mycode -> start] = 0; 
else 
mycode ->bit[mycode -> start] =1; 
mycode 一 > start ——; 
child = parent; 
parent = haffTree[ child]. parent; 
上 
for(int j=mycode 一 > start +1;j<n;j++) 
haffCode[ i].bit[j] = mycode 一 >bit[j]; 
haffCode[ i]. start = mycode 一 > start; 
haffCode[ i]. weight = mycode 一 > weight; 
} 
delete [] mycode; 
} 


图 8-25 为 最 优 二 又 树 求 哈 夫 曼 编 码 图 。 
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而 最 优 一 又 再 求 只 夫 受 闹 码 电动 
维 SEE 个 字母 作为 测试 数据 。 ~ 


母 a 到 字母 E 这 5 个 字母 随机 产生 的 权 是 : 


星 35 
村 61 
?74 
和 36 
年 1 

到 字母 E 的 哈 夫 县 编码 是 ， 


是 ,1111 
: 18 
码 是 ， 9 
: 118 
曼 编 码 是 ，1119 过 


图 8-25 最 优 二 叉 树 求 哈 夫 曼 编码 图 


8.10 树 、 森 林 和 二 叉 树 的 关系 


现实 中 的 数据 模型 多 为 树 或 森林 结构 ,讨论 了 二 叉 树 后 ,下 面 讨论 相互 转换 的 规则 。 

先 采 用 图 示 法 讨论 树 如 何 转 换 成 二 叉 树 ,然后 再 讨论 在 计算 机 存储 中 如 何 实现 。 

图 示 中 转换 规则 如 下 : 

(1) 改 链 。 把 所 有 的 兄弟 关系 之 间 进 行 连 线 ,同时 把 除了 第 一 个 儿子 外 的 其 他 所 有 父 
子 线 都 删除 。 

(2) 拉 直 。 以 根 为 基准 不 动 ,拉动 最 右边 的 某 个 结 点 使 得 所 有 的 斜 线 都 变 成 垂直 。 

(3) 旋转 。 以 根 为 基准 不 动 ,拉动 最 右边 的 某 个 结 点 使 得 所 有 的 结 点 一 起 向 顺 时 针 方 
向 旋转 45"。 此 时 所 有 的 儿子 关系 都 有 左右 关系 了 ,并 且 最 大 的 儿子 个 数 只 有 2 了 。 

图 8-26 展示 了 一 棵 树 变换 成 二 叉 树 的 过 程 。 


8-26 ” 树 转换 成 二 叉 树 的 示意 图 


在 构造 过 程 中 需要 注意 以 下 几 点 : 

(1) 不 论 原来 只 有 一 个 儿子 的 情况 画 的 时 候 有 没有 偏离 直线 ,转换 后 只 能 是 左 儿 子 。 

(2) 如 果 原 来 的 树 中 有 一 个 结 点 有 两 个 儿子 ,并且 画 的 也 是 有 左右 之 分 ,但 是 必须 按照 
这 里 的 转换 规则 进行 ,因为 树 就 是 树 ,其 中 的 局 部 也 不 是 二 又 树 。 

下 面 讨论 在 计算 机 存储 中 如 何 实现 这 种 转换 。 

实际 存储 中 将 采用 链表 结构 做 成 的 儿子 兄弟 挂 链 法 , 即 作为 父亲 的 左 链 域 挂 第 一 个 儿 
子 , 而 所 有 右 链 域 挂 上 依次 兄弟 关系 的 结 点 。 
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从 树 转换 成 的 二 叉 树 根 结 点 是 不 会 有 右 儿 子 的 。 如 果 一 棵 二 叉 树 的 根 结 点 本 身 有 右 儿 
子 , 又 代表 什么 情况 呢 ? 

实际 上 这 就 是 森林 结构 ,因为 森林 由 多 棵 树 组 成 ,下 面 给 出 其 转换 规则 。 

第 一 种 思路 是 先 把 其 中 的 每 一 棵 二 又 树 按照 上 面 的 规则 进行 转换 ,之 后 按照 下 面 的 规 
则 连接 在 一 起 ,利用 每 一 棵 二 又 树 根 没 有 右 儿 子 的 特点 ,把 每 一 棵 新 的 树 转换 后 的 二 又 树 依 
次 挂 在 上 一 棵 二 叉 树 的 右 儿 子 位 置 上 。 

第 二 种 思路 是 启用 树 和 森林 的 辩证 关系 ,增加 一 个 虚拟 结 点 作为 所 有 树 的 根 的 父亲 结 
点 ,此 时 就 变 成 了 一 棵 二 又 树 ,再 根据 上 述 规则 转换 ,转换 后 由 于 虚拟 结 点 并 不 存在 ,所 以 再 
把 它 删 除 即 可 。 

这 两 种 思路 结果 是 一 样 的 ,根据 这 样 的 转换 规则 ,在 二 叉 树 中 很 容易 求 出 原来 对 应 的 森 
林 中 树 的 个 数 , 那 就 是 从 根 一 直 往 右 儿 子 走 下 去 ,同时 启用 计数 器 ,就 可 以 统计 出 原来 树 的 
个 数 。 

把 二 又 树 转换 成 树 或 者 森林 的 方法 就 是 上 面 讨 论 的 逆 过 程 ,如 : 先 逆 时 针 方 向 旋转 
45", 再 向 左边 推 压 ,把 边 的 形状 变 成 相对 某 个 结 点 左右 对 称 的 位 置 , 再 改 链 ,把 所 有 的 横 边 
全 部 删除 ,同时 回 挂 在 上 面 的 一 个 结 点 上 ,作为 它 的 儿子 。 如 果 原 来 二 叉 树 的 根 有 右 儿 子 
则 依次 把 每 一 个 都 分 开 , 则 可 以 变 成 森林 。 

根据 以 上 讨论 可 知 , 树 .森林 和 二 又 树 之 间 存 在 唯一 的 互相 转换 规则 ,利用 删除 根 结 点 
和 增加 一 个 根 结 点 ,可 以 把 森林 和 树 进 行 转换 。 推 出 二 叉 树 则 是 为 了 解决 树 或 森林 的 存储 
困难 ,但 是 在 实际 编程 中 ,如 果 二 又 树 的 层 数 过 深 而 严重 影响 时 间 效 率 的 话 ,还 会 采用 更 多 
儿子 的 树 形 结构 。 


8.11 本 章 总 结 


本 章 介绍 了 数据 结构 树 ,森林 和 二 叉 树 ,而 二 叉 树 主要 是 为 了 解决 树 和 森林 在 存储 中 过 
到 的 困难 。 它 的 特点 是 一 个 结 点 最 多 只 有 两 个 儿子 ,而且 有 左右 之 分 ,这 样 的 数据 结构 在 存 
储 和 算法 实现 中 有 很 多 的 方便 性 。 在 讨论 了 它 的 存储 结构 和 基本 算法 之 后 ,给 出 了 多 个 程 
序 源码 ,讨论 了 树 、 森 林 和 二 又 树 互相 转换 的 方法 。 最 后 的 表达 式 计 算 程序 设计 充分 利用 了 
二 叉 树 的 知识 。 


习 题 
一 、 原 理 讨论 题 
1. 为 什么 会 有 二 又 树 这 种 逻辑 结构 ? 
2. 二 叉 树 和 树 有 什么 区 别 ? 
3 


. 二 叉 树 存储 时 主要 有 哪 几 种 方法 ? 

4. 如 果 5 个 结 点 全 部 依次 为 右 儿子 ( 即 单 枝 二 叉 树 ) ,使 用 顺序 存储 的 思路 需要 多 少 个 
数组 空间 ? 

5. 树 、 森 林 和 二 又 树 之 间 有 唯一 的 转换 规则 吗 ? 如 何 转换 ? 

6. 如 果 已 知 根 序 遍 历 中 的 两 种 ,是 否 可 以 恢复 原来 的 二 叉 树 ?给 出 一 批 数据 进行 
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研究 。 
二 、 理论 基本 题 
1. 夯 出 5 种 基本 的 二 叉 树 形态 。 
2. 写 出 以 下 概念 的 定义 : 二 叉 树 满 二 又 树 .完全 二 叉 树 。 
3. 写 出 二 叉 树 中 的 数学 性 质 。 
4. 写 出 二 叉 树 主要 的 操作 清单 。 
5. 给 出 几 个 数据 , 画 出 二 叉 树 顺序 存储 结构 的 示意 图 。 
6 
六 
8 


.给 出 几 个 数据 , 画 出 二 又 树 链接 存储 结构 的 示意 图 。 
.自己 画 出 一 个 二 叉 树 (至 少 有 四 层 ) ,给 出 先 根 . 中 根 、 后 根 遍 历 的 结果 。 
.自己 画 出 一 个 二 叉 树 (至 少 有 四 层 ) ,给 出 层次 遍历 的 结果 ,并 写 出 程序 设计 中 使 用 
的 主要 数据 结构 。 
9. 把 表达 式 8X (5 一 3) 十 6/3 一 7 画 成 二 叉 树 ,再 写 出 3 种 根 序 遍历 的 结果 。 
10. 把 上 题 的 结果 画 出 3 种 根 序 遍历 的 线索 树 。 
11. 给 出 3,5,6,8 作为 权 值 , 画 出 最 优 二 又 树 ,计算 出 WPL 值 。 
12. 读者 自己 给 出 7 个 字母 , 写 出 这 些 字 符 的 使 用 频率 ,并 构造 其 哈 夫 曼 编 码 。 
13. 夯 出 一 棵 树 ,把 它 转换 成 二 又 树 。 
14. 画 出 森林 ,把 它 转换 成 二 又 树 。 
15. 画 出 一 棵 二 又 树 ,把 它 转换 成 树 或 森林 。 
、 编 程 基本 题 
. 实现 输入 二 又 树 结 点 信息 ,在 屏幕 上 输出 二 又 树 的 所 有 结 点 信息 。 
. 实现 统计 二 又 树 的 结 点 个 数 。 
. 实现 求 二 又 树 的 深度 的 程序 。 
. 实现 求 二 又 树 中 各 结 点 所 在 层次 的 程序 。 
. 实现 先 根 、 中 根 、 后 根 遍历 的 递归 算法 。 
. 实现 先 根 、 中 根 、 后 根 遍历 的 非 递 归 算 法 。 
. 实现 层次 遍历 的 算法 。 
.完全 二 叉 树 用 顺序 存储 法 ,实现 后 根 遍历 。 
. 实现 哈 夫 曼 树 的 构成 。 
10. 使 用 计算 机 自动 产生 一 万 个 数据 ,按照 哈 夫 曼 算法 对 分 数 分 类 转换 的 思路 进行 编 
程 ,并 和 传统 的 编程 思想 实现 的 程序 进行 时 间 效率 对 比 。 
11. 实现 哈 夫 曼 编码 的 构成 。 
四 、 编 程 提高 题 
. 编程 实现 把 二 叉 树 中 所 有 左右 儿子 交换 的 程序 。 
. 在 二 叉 树 中 查找 到 某 个 结 点 ,把 其 所 有 祖先 都 显示 出 来 。 
. 给 出 中 根 遍 历 的 结果 和 后 根 遍历 的 结果 ,编程 恢复 原来 的 二 又 树 。 
. 实现 复制 一 个 二 又 树 的 程序 。 
. 实现 比较 两 个 二 叉 树 是 否 完全 一 致 。 
五 、 思 考题 
1. 二 叉 树 的 存储 可 以 把 链表 的 思想 转换 成 结构 体 数 组 来 实现 。 三 列 的 含义 分 别 为 


| 


cn 性 
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lchild,data,rchild。lchild 和 rchild 存储 data 的 左右 儿子 在 数组 中 的 下 标 地 址 ,之 后 可 以 写 
出 相应 的 主要 程序 设计 。 

2. 不 用 栈 的 二 又 树 遍历 的 非 递归 方法 。 上 面 介 绍 了 二 又 树 的 遍历 算法 ,主要 分 为 两 
类 : 一 类 是 利用 二 又 树 结 构 的 递归 性 ,采用 递归 算法 ; 另 一 类 则 是 通过 堆栈 或 队列 来 辅助 
实现 。 采 用 这 两 类 方法 对 二 又 树 进 行 遍 历时 ,递归 调用 和 栈 的 使 用 都 会 带 来 额外 的 空间 增 
加 。 递 归 调 用 的 深度 和 栈 的 大 小 是 动态 变化 的 ,与 二 叉 树 的 高 度 有 关 。 因 此 ,在 最 坏 的 情况 
下 , 即 二 又 树 退化 为 单 枝 树 的 情况 下 ,递归 的 深度 或 栈 所 需要 的 空间 等 于 二 叉 树 中 的 结 点 
数 。 下 面 推 出 一 种 新 的 思路 ,不 用 栈 也 不 用 递归 来 实现 。 常 用 的 不 用 栈 的 二 叉 树 遍历 的 非 
递归 方法 有 以 下 3 种 : 

(1) 对 二 叉 树 采用 三 叉 链 表 存 放 , 即 在 二 又 树 的 每 个 结 点 中 增加 一 个 父亲 域 father, 在 
遍历 深入 到 底 时 ,可 沿 着 走 过 的 路 径 回 退 到 任何 一 棵 子 树 的 根 结 点 ,并 再 向 男 一 方向 走 。 这 
一 方法 的 实现 是 在 每 个 结 点 原来 的 存储 结构 上 又 增加 一 个 父亲 域 , 故 其 存储 开销 继续 增加 。 

(2) 采用 逆转 链 的 方法 , 即 在 遍历 深入 时 ,每 深入 一 层 ,就 将 其 再 深入 的 儿子 结 点 的 地 
址 取出 ,并 将 其 父亲 结 点 的 地 址 存 和 人, 当 深入 不 下 去 需 返 回 时 ,可 逐 级 取出 父亲 结 点 的 地 址 ， 
沿 原 路 返回 。 虽然 此 种 方法 是 在 二 又 链表 上 实现 的 ,没有 增加 过 多 的 存储 空间 ,但 在 执行 遍 
历 过 程 中 改变 子女 指针 的 值 ,这 即 是 以 时 间 换 取 空 间 , 同 时 当 有 几 个 用 户 同 时 使 用 这 个 算法 
时 将 会 发 生 问 题 。 

(3) 在 线索 二 叉 树 上 的 遍历 , 即 利用 具有 mn 个 结 点 的 二 叉 树 中 的 叶子 结 点 和 1 度 结 点 
的 n 十 1 个 空 指 针 域 ,来 存放 线索 ,然后 在 具有 线索 的 二 又 树 上 遍历 时 ,就 可 不 需要 栈 , 也 不 
需要 递归 了 。 


< 178 


第 9 章 ”图 的 构造 与 应 用 


本 章 介绍 非 线性 数据 结构 一 一 图 ,以 及 它 的 存储 结构 实现 。 图 可 以 表示 现实 生活 中 任 
何 复杂 的 关系 模型 ,本 章 介绍 了 图 的 遍历 操作 以 及 其 他 主要 操作 的 程序 实现 ,并 给 出 了 图 的 
多 个 应 用 案例 。 最 小 代价 生成 树 和 最 短路 径 问题 是 无 向 图 的 主要 应 用 ,而 拓扑 排序 的 生成 
是 有 向 图 的 主要 应 用 。 


9.1 引 


了 中 


本 章 将 介绍 数据 结构 图"。 它 是 最 复杂 的 非 线性 结构 ,其 特点 是 任何 结 点 之 间 都 可 以 
有 关系 , 它 的 关系 表达 能 力 涵盖 现实 生活 中 任何 复杂 的 关系 结构 ,如 从 《中 国 交通 图 ) 一 书 中 
可 以 看 到 中 国 的 铁路 .公路 和 航空 线路 图 ,这 些 图 都 是 “图 ?关系 最 好 的 范例 。 

计算 机 界 有 一 句 名言 : 千言 万 语 不 如 一 张 图 。 图 结构 是 比 树 形 结构 更 复杂 的 非 线 性 结 
构 。 由 于 图 结构 被 用 于 描述 各 种 复杂 的 数据 对 象 ,在 自然 科学 、 社 会 科学 和 人 文科 学 等 领域 
也 有 着 非常 广泛 的 应 用 ,所 以 有 必要 深入 了 解 图 的 性 质 、 存 储 结构 和 基本 操作 的 编程 实现 。 

用 计算 机 处 理 图 形 有 两 个 层次 。 第 一 个 层次 仅仅 是 图 片 ,就 是 为 了 看 上 去 更 接近 真实 
情况 ,如 照片 .图 画 等 ,从 数据 结构 的 角度 观察 就 是 二 维 数组 的 具体 应 用 ; 第 二 个 层次 是 保 
持 形象 化 的 同时 进行 更 深入 的 数据 处 理 , 如 一 张 地 图 上 要 求 查询 某 两 个 城市 之 间 的 所 有 通 
路 或 火车 票 价 格 等 信息 ,一 个 城市 地 图 中 查询 某 两 处 直接 距离 和 公路 距离 ,查询 某 地 附近 最 
近 的 加 油 站 等 ,此 时 必然 涉及 更 复杂 的 数据 结构 。 也 就 是 说 ,从 屏幕 上 可 以 看 到 各 种 非常 人 
性 化 的 图 片 或 图 形 显示 ,但 是 在 底层 实际 上 是 多 种 数据 结构 的 体现 。 

在 图 结构 中 ,任意 两 个 结 点 之 间 都 可 能 有 关系 ,这 使 得 在 存储 和 编程 时 会 遇 到 很 多 新 的 
困难 。 任 何 复杂 的 关系 都 可 以 通过 计算 机 表示 出 来 。 


9.2 图 的 逻辑 结构 


图 (Graph) 是 由 非 空 的 项 点 集合 和 用 于 描述 顶点 之 间 关 系 的 边 ( 或 弧 ) 的 集合 组 成 ,其 
形式 化 定义 为 : 
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G=(V,E) 

其 中 V={vi| vi EDataObject} ,E={(vi, v)| vi, vEV APCvn， v)}。 

G 表示 一 个 图 ,V 是 图 G 中 顶点 的 集合 ,E 是 图 G 中 边 的 集合 ,集合 下 中 PCvi, vi) 表 示 
顶点 v; 和 顶点 vi 之 间 有 一 条 直接 连 线 , 即 偶 对 (vi，w) 表 示 一 条 边 。 

(1) 无 向 图 。 在 一 个 图 中 ,如 果 任 意 两 个 项 点 构成 的 偶 对 (v;, vi)EE 是 无 序 的 , 即 顶 点 
之 间 的 连 线 是 没有 方向 的 , 则 称 该 图 为 无 向 图 。 

(2) 有 向 图 。 在 一 个 图 中 ,如 果 任 意 两 个 项 点 构成 的 偶 对 (vi, vi)EE 是 有 序 的 , 即 顶 点 
之 间 的 连 线 是 有 方向 的 , 则 称 该 图 为 有 向 图 。 

(3) 顶点 . 边 、 弧 、 弧 头 、 弧 尾 。 在 图 中 ,数据 元 素 vi 称 为 项 点 ,P(vi, vi) 表 示 在 顶点 vi 
和 顶点 vi 之 间 有 一 条 直接 连 线 。 如 果 是 在 无 向 图 中 , 则 称 这 条 连 线 为 边 ; 如 果 是 在 有 向 图 
中 ,一般 称 这 条 连 线 为 弧 。 边 用 项 点 的 无 序 偶 对 (vi，vi) 来 表示 , 称 顶 点 v; 和 顶点 vi 互 为 邻 
接点 , 边 (vi, vi) 依 附 于 顶点 vi 与 项 点 vi; 弧 用 顶点 的 有 序 偶 对 < v;，v; > 来 表示 ,有 序 偶 对 
的 第 一 个 结 点 vi 被 称 为 始点 (或 弧 尾 ) ,在 图 中 就 是 不 带 箭头 的 一 端 ; 有 序 偶 对 的 第 二 个 结 
点 vi 被 称 为 终点 (或 弧 头 ) ,在 图 中 就 是 带 箭头 的 一 端 。 

图 9-1 给 出 了 现实 模型 图 、 无 向 图 和 有 向 图 示意 图 。 

图 9-1 中 的 无 向 图 表示 为 ; 


集合 V= {a,b, c, d, ev f}; 
集合 E= {(a,b), (a, c), (a,f), (b,e), (c,f), (d,e)} 


图 9-1 中 的 有 向 图 表示 为 : 


集合 V= {a,b, c, d, e, f}; 
集合 E= {<b,a>, <b,c>, <c,b>, <c,e>, <d,b>, <d,e>, <d,f>, <e,c>, <f,d>} 


(a) 现实 模型 图 (b) 无 向 图 (c) 有 向 图 
图 9-1 现实 模型 图 ,无 向 图 和 有 向 图 示意 图 


(4) 无 向 完全 图 。 在 一 个 无 向 图 中 ,如 果 任 意 两 顶点 间 都 有 一 条 直接 边 相 连接 , 则 称 
该 图 为 无 向 完全 图 。 如 果 只 有 两 个 结 点 ,最 多 的 边 数 为 1。3 个 结 点 对 应 的 最 多 边 数 为 
3 ,而 4 个 结 点 对 应 的 最 多 边 数 为 6。 可 以 证 明 , 在 一 个 含有 nm 个 顶点 的 无 向 完全 图 中 ,有 
n(n 一 1)/2 条 边 。 

(5) 有 向 完全 图 。 在 一 个 有 向 图 中 ,如 果 任 意 两 顶点 之 间 都 有 方向 互 为 相反 的 两 条 弧 
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相连 接 , 则 称 该 图 为 有 向 完全 图 。 在 一 个 含有 n 个 顶点 的 有 向 完全 图 中 ,有 n(n 一 1) 条 边 。 

(6) 稠密 图 、 稀 朴 图 。 若 一 个 图 接近 完全 图 , 称 为 稠密 图 ,其 边 数 相 当 多 ,表示 关系 复 
杂 ; 边 数 很 少 的 图 称 为 稀疏 图 ,表示 结 点 之 间 的 关系 不 密切 。 

(7) 顶点 的 度 、 入 度 、 出 度 。 顶 点 的 度 (degree) 是 指 依附 于 某 顶 点 v 的 边 数 ,通常 记 为 
TD(v)。 在 有 向 图 中 ,要 区 别 顶 点 的 人 度 与 出 度 的 概念 。 顶 点 v 的 入 度 是 指 以 顶点 为 终点 
的 弧 的 数目 , 记 为 IDCv); 顶点 v 的 出 度 是 指 以 顶点 v 为 始点 的 弧 的 数目 , 记 为 OD(v)。 
TDCv =IDCv) 十 ODCv) 。 


Ee ETD) 

可 以 证 明 , 对 于 具有 nn 个 顶点 、e 条 边 的 图 ,顶点 vi 的 度 TD(Cvi) 与 顶点 的 个 数 以 及 边 的 
数目 满足 关系 。 

(8) 边 的 权 、 网 图 。 与 边 有 关 的 数据 信息 称 为 权 (weight) 。 在 实际 应 用 中 , 权 值 通常 代 
表 一 种 代价 或 其 他 信息 。 如 ,在 一 个 反映 城市 交通 线路 的 图 中 , 边 上 的 权 值 可 以 表示 该 条 线 
路 的 长 度 ; 对 于 一 个 电子 线路 图 , 边 上 的 权 值 可 以 表示 两 个 端点 之 间 的 电阻 .电流 或 电压 
值 ; 对 于 反映 工程 进度 的 图 而 言 , 边 上 的 权 值 可 以 表示 从 前 一 个 工程 到 后 一 个 工程 所 需要 
的 时 间 等 。 边 上 带 权 的 图 称 为 网 图 或 网 络 (network)。 

图 9-2 给 出 了 无 向 网 图 和 有 向 网 图 的 示意 图 。 每 一 
条 边 的 旁边 的 数字 就 是 “ 权 值 ”。 

在 图 的 讨论 中 有 几 个 重要 成 分 : 结 点 (名 )、 边 、 边 的 
方向 \, 权 。 它 们 代表 了 使 用 计算 机 处 理 现实 问题 中 最 关 
心 的 层面 或 要 素 。 如 交通 网 络 只 考虑 是 否 能 抵达 ,就 是 
无 向 图 ; 但 是 如 果 考 虑 成 本 ,就 应 该 是 有 向 网 ; 从 水 路 来 
理解 , 顺 江 而 下 和 逆流 而 上 的 船只 无 论 是 时 间 、 耗 油 . 人 
工 成 本 等 都 不 一 样 。 图 9-2 无 向 网 图 和 有 向 网 

i 图 的 示意 图 

(9) 路 径 、 路 径 长 度 。 顶 点 w 到 顶点 vs 之 间 的 路 径 
(path) 是 指 顶点 序列 vo ,vasve，…,vVin,va。 其 中 ,(v,， 

Vu) 《VasVe) (VinsVa) 分 别 为 图 中 的 边 。 路 径 上 边 的 数目 称 为 路 径 长 度 。 图 9-2 所 示 的 
无 向 图 中 ,顶点 a 到 顶点 d 的 路 径 , 路 径 长 度 为 3。 

(10) 回路 ,简单 路 径 、 简 单 回路 。 如 果 顶 点 从 vi 出 发 又 回 到 vi , 则 该 路 径 称 为 回路 或 者 
环 (cycle)。 序 列 中 顶点 不 重复 出 现 的 路 径 称 为 简单 路 径 。 在 图 9-2 中 ,ab>e>d 就 是 简 
单 路 径 。 除 第 一 个 顶点 与 最 后 一 个 顶点 之 外 ,其 他 顶点 不 重复 出 现 的 回路 称 为 简单 回路 ,或 
者 简单 环 ,比如 ac 人 >a。 

(11) 子 图 。 对 于 图 G 二 (V,E),G'==(V',E'), 若 存在 V' 是 V 的 子 集 ,E' 是 下 的 子 集 ， 
则 称 图 G' 是 G 的 一 个 子 图 。 

图 9-3 为 无 向 图 和 有 向 图 的 子 图 示意 图 。 子 图 本 身 的 合法 性 是 子 图 存在 的 前 提 , 不 能 
有 不 依赖 结 点 的 边 的 存在 。 

(12) 连通 的 .连通 图 .连通 分 量 。 在 无 向 图 中 ,如 果 从 一 个 顶点 w 到 另 一 个 顶点 (Ci 夫 j) 
有 路 径 , 则 称 顶点 vi 和 v; 是 连通 的 。 如 果 无 向 图 中 任意 两 顶点 都 是 连通 的 , 则 称 该 图 是 连 
通 图 。 无 向 图 的 极 大 连通 子 图 称 为 连通 分 量 , 即 该 连通 分 量 不 能 再 增加 任何 一 个 新 结 点 ， 


(a) 无 向 网 图 (b) 有 向 网 图 
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(a) 无 向 图 的 子 图 (b) 有 向 图 的 子 图 
图 9-3 无 向 图 和 有 向 图 的 子 图 示意 图 
否则 就 会 出 现 不 连通 的 情况 。 


(13) 强 连 通 图 、 强 连通 分 量 。 对 于 有 向 图 来 说 , 若 图 中 任意 一 对 顶点 v; 和 vi; (i 去)) 均 有 
从 一 个 顶点 vi 到 另 一 个 顶点 v 的 路 径 ,也 有 从 vi 到 vi 的 路 径 , 则 称 该 有 向 图 是 强 连通 图 。 
有 向 图 的 极 大 强 连通 子 图 称 为 强 连通 分 量 。 图 9-4 为 连通 分 量 的 示意 图 。 


CaoD Gda02) 2 > 

Ca03) CD CD ECD 
HD A 

a) Cd) Ga) al) 


(a) 无 向 图 的 连通 分 量 : 2 个 (b) 有 向 图 的 连通 分 景 :3 个 
9-4 连通 分 量 的 示意 图 


(14) 生成 树 。 所 谓 连通 图 G 的 生成 树 , 是 G 的 包含 其 全 部 n 个 顶点 的 一 个 极 小 连通 
子 图 。 它 必定 包含 且 仅 包含 G 的 n 一 1 条 边 。 这 个 生成 树 首先 要 保证 图 的 连通 性 ,其 次 边 
的 个 数 为 唯一 的 值 , 再 多 一 条 必然 出 现 回路 ,再 少 一 条 边 必 然 出 现 不 连通 的 图 。 

图 9-5 为 生成 树 的 示意 图 。 它 的 应 用 背景 是 以 较 小 的 代价 达到 同样 的 目的 。 如 构造 城 
市 间 的 电话 网 ,按照 图 9-5(a) 要 多 搭建 很 多 线路 ,图 9-5(b) 则 既 保 持 了 连通 ,又 没有 回路 ， 
可 以 保证 任何 两 个 城市 之 间 的 通话 。 这 种 结构 仅 考虑 了 成 本 因素 ,在 实际 运用 中 缺乏 安全 
性 。 有 一 些 结 点 被 称 为 “瓶颈 ? 结 点 ,如 下 面 生成 树 中 的 郑州 ,一 旦 出 现 故障 , 则 两 边 很 多 城 
市 之 间 都 不 再 能 保持 通信 功能 。 


图 9-5 生成 树 的 示意 图 
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(15) 生成 森林 。 在 非 连通 图 中 ,由 每 个 连通 分 量 都 可 得 到 一 个 极 小 连通 子 图 , 即 一 棵 
生成 树 。 这 些 连通 分 量 的 生成 树 就 组 成 了 一 个 非 连通 图 的 生成 森林 。 

表 9-1 为 图 的 常用 操作 清单 。 在 一 个 图 中 ,顶点 的 关系 是 平等 的 ,没有 所 谓 的 父子 关 
系 , 但 当 采 用 某 一 种 确定 的 存储 方式 存储 后 ,存储 结构 中 顶点 存储 的 先后 次 序 构 成 了 顶点 之 
间 的 相对 次 序 。 


表 9-1 图 的 常用 操作 清单 


操作 名 称 建议 算法 名 称 编程 细节 约定 
图 的 初始 化 creatgraph(G) 输入 图 G 的 顶点 和 边 ,建立 图 G 的 存储 
图 的 销毁 destroygraph(G) 释放 图 G 占用 的 存储 空间 
查找 结 点 getvex(G,v) 在 图 G 中 找到 顶点 v, 并 返回 顶点 v 的 相关 信息 
给 结 点 赋值 putvex(G,v,value) 在 图 G 中 找到 顶点 v, 并 将 value 值 赋 给 顶点 v 
增加 新 结 点 insertvex(G,v) 在 图 G 中 增加 新 顶点 v 

结 

人 cetevex(Gww | 在 图 中 , 避 除 大 点 v 以 及 所 有 和 顶点 相关 联 的 边 或 
增加 新 边 insertarc(G,v,w) 在 图 G 中 增添 一 条 从 顶点 v 到 顶点 w 的 边 或 弧 
删除 边 deletearc(G,v,w) 在 图 G 中 删除 一 条 从 顶点 v 到 顶点 w 的 边 或 弧 


深度 优先 遍历 DFStraverse(G,v) 在 图 G 中 ,从 顶点 v 出 发 深度 优先 遍历 图 G 

广度 优先 遍历 BFSttaverse(G,v) 在 图 G 中 ,从 顶点 v 出 发 广度 优先 遍历 图 G 

查找 结 点 的 位 置 | locatevex(G,u) 在 图 G 中 找到 顶点 u, 返 回 该 顶点 在 图 中 的 位 置 

在 图 G 中 ,返回 v 的 第 一 个 邻接 点 。 若 顶点 在 G 中 没有 邻接 
顶点 , 则 返回 “ 空 ” 

在 图 G 中 ,返回 v 的 (相对 于 w 的 ) 下 一 个 邻接 顶点。 若 w 是 
v 的 最 后 一 个 邻接 点 , 则 返回 “ 空 


求 第 一 个 邻接 点 | firstadjvex(G,v) 


求 下 一 个 邻接 点 | nextadjvex(G,v,w) 


9.3 图 的 顺序 存储 


图 的 结构 很 复杂 ,主要 包括 两 部 分 , 即 图 中 顶点 的 信息 以 及 描述 顶点 之 间 的 关系 一 一 边 
或 者 弧 的 信息 。 无 论 采用 什么 存储 结构 ,都 要 完整 准确 地 反映 这 两 方面 的 信息 。 结 点 个 数 
是 动态 的 ,可 以 增加 或 减少 ,这 需要 线性 表 部 分 的 相关 理论 知识 的 支撑 ; 由 于 在 删除 结 点 时 
必须 把 相关 的 边 全 部 删除 ,所 以 还 涉及 边 的 存储 结构 ,因为 边 个 数 的 不 确定 性 和 动态 性 ,图 
的 存储 困难 和 树 结 构 有 类 似 之 处 。 在 本 章 通 过 “和 矩阵 ”的 知识 很 简单 地 就 解决 了 图 的 存储 问 
题 ,而 对 于 边 的 个 数 的 不 确定 性 ,链表 也 会 是 很 好 的 选择 。 

下 面 首先 介绍 常用 的 邻接 矩阵 存储 结构 。 

邻接 矩阵 (Adjacency Matrix) 用 一 维 数组 存储 图 中 顶点 的 信息 ,用 二 维 数组 表示 图 中 
各 顶点 之 间 的 邻接 关系 ,通过 行 和 列 的 交叉 点 坐标 来 表示 关系 。 假 设 图 G 王 (V,E) 有 nm 个 
确定 的 顶点 , 即 V=={vo ,vi,… ,va-1), 则 表示 G 中 各 顶点 相 邻 关系 为 一 个 nXn 的 矩阵 ,和 矩 
阵 的 元 素 为 : 
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若 (vi,vi) 或 < viyvi > 是 E(G) 中 的 边 


E 
AD-| 
0 若 (vi,vi) 或 <vi,vi > 不 是 E(G) 中 的 边 
若 G 是 网 图 , 则 邻接 矩阵 可 定义 为 : 
Wi 车 (vi,vj) 或 < vvi > 是 E(G) 中 的 边 
| 
0 或 2o 车 (vi,vi) 或 <vi,vi > 不 是 E(G) 中 的 边 
其 中 ,wi 表示 边 (vi,vi) 或 < vi ,vi > 上 的 权 值 ; 表示 没有 关系 的 边 , 实 现时 使 用 计算 机 
允许 的 .大 于 所 有 边 上 权 值 的 数 即 可 ,也 可 以 使 用 权 值 中 不 存在 的 负 值 表示 。 注 意 在 网 图 
中 , 结 点 到 自身 的 代价 为 0, 其 他 结 点 之 间 没 有 关系 的 情况 下 , 才 取 值 = 。 在 程序 设计 中 ， 
为 了 统一 起 见 , 没 有 权 值 的 情况 下 也 可 以 使 用 带 权 图 的 做 法 ,只 不 过 把 权 值 约定 都 是 1 
即 可 。 
图 9-6 为 无 向 图 和 有 向 图 的 邻接 矩阵 示意 图 。 


@ (b) 011001 000000 
\y 100010 101000 
Ac|100001 _|o1oo010 
@ (a) 000010 © Cd joroori 
人 N 010100 OO) 站 001000 
Ae 101000 © (5 000100 
(a) 无 向 图 邻接 矩阵 (b) 有 向 图 邻接 和 矩阵 
图 9-6 ”邻接 矩阵 示意 图 
图 的 邻接 矩阵 存储 方法 有 以 下 优点 : 


@ 无 向 图 的 邻接 矩阵 一 定 是 对 称 和 矩阵 。 因 此 在 具体 存储 邻接 矩阵 时 只 需 存 放 上 (或 
下 ) 三 角 和 矩阵 的 元 素 。 

@ 无 向 图 邻接 矩阵 的 第 i 行 (或 第 i 列 ) 非 零 元 素 ( 或 非 == 元 素 ) 的 个 数 正 好 是 第 i 个 项 
点 的 度 TDCvi) 。 

@ 有 向 图 邻接 矩阵 的 第 i 行 (或 第 i 列 ) 非 零 元 素 ( 或 非 <= 元 素 ) 的 个 数 正好 是 第 i 个 项 
点 的 出 度 OD(Cvi) (或 人 度 IDCvi) ) 。 

@ 用 邻接 矩阵 方法 存储 图 很 容易 确定 图 中 任意 两 个 顶点 之 间 是 否 有 边 相连 ; 但 是 ,要 
确定 图 中 有 多 少 条 边 , 则 必须 对 矩阵 进行 遍历 ,时 间 效 率 较 低 。 

下 面 讨 论 用 邻接 矩阵 存储 表示 法 来 实现 图 的 基本 操作 。 要 确定 图 的 顶点 数 和 边 数 , 然 
后 采用 一 维 数组 来 存储 顶点 信息 ,下 面 使 用 的 是 字符 型 数组 ,最 后 要 用 二 维 数组 存储 结 点 之 
间 的 相 邻 关系 。 

由 于 图 的 基本 数据 较 多 ,用 键盘 输入 的 方式 很 不 方便 ,一 旦 出 错 也 不 能 当时 修改 。 在 下 
面 的 有 关 图 的 程序 设计 中 ,所 有 数据 都 从 文本 文件 中 读 入 。 

在 实现 图 的 数据 结构 和 编程 实现 相关 操作 时 ,需要 启用 线性 表 、 栈 和 队列 等 其 他 基础 数 
据 结构 ,下 面 的 程序 就 采用 了 顺序 表 和 环 队 。 

下 面 讨论 邻接 矩阵 存储 图 的 源码 。 本 程序 可 以 进行 图 的 基本 功能 实现 展示 。 存 储 结构 
使 用 邻接 矩阵 ,约定 如 下 : 

(1) 手工 输入 数据 时 可 以 兼容 无 向 图 和 有 向 图 。 每 个 边 都 只 需要 输入 一 次 。 
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(2) 默认 数据 是 一 个 无 向 图 ,每 个 边 都 自动 输入 了 两 次 。 默 认 数 据 边 的 值 全 部 约定 为 
1, 代 表 此 图 不 带 权 值 。 
(3) 文件 读 和 数据 只 承认 无 向 图 ,每 个 边 只 需要 输入 一 次 。 


数据 文件 的 内 容 如 下 : 
// 无 向 图 ,不 处 理 权 值 ,为 了 统一 , 权 值 的 位 置 均 赋值 1 
// 以 下 为 结 点 名 
abcdefg 
// 以 下 为 边 的 信息 ,只 需要 输入 1 次 ,计算 机 内 部 自动 存 2 次 
011 
021 
在 侣 寺 
六 号 入 
261 
人 包 时 
451 
【程序 源码 9-1】 用 邻接 矩阵 存储 图 的 部 分 程序 源码 。 
// 图 类 
const int maxvertices = 26; // 定 义 结 点 个 数 最 大 值 为 26 
const int maxweight = 10000; // 当 两 个 结 点 之 间 不 存在 边 时 距离 
// 无 穷 大 用 10000 来 模拟 
class graph 
{ 
private: 
int 1,j; // 循 环 变量 
int flag; // 标 志 位 
int inputnodenum, inputedgenum; // 输 入 的 结 点 个 数 、 边 数 
int numofedges; // 记 录 边 的 条 数 
char * nodearray; // 输 入 结 点 时 使 用 的 一 维 数组 
SeqList Vertices; // 图 的 结 点 信息 ,启用 了 线性 表 
int Edge[ maxvertices][maxvertices]; // 图 的 边 信息 ,使 用 了 二 维 数组 ,是 
// 一 个 方 阵 
public: 
graph( const int size = maxvertices); // 图 的 构造 函数 
~graph( ){}; // 图 的 析 构 函数 
void initializationofEdge( int size); // 边 的 邻接 矩阵 初始 化 
void inputdata( ) // 手 工 输入 数据 
void defaultdata( ); // 启 用 默认 数据 
returninfo readfile(char * filename); // 使 用 文件 读 和 人 
void showgraph( ); // 显 示 图 的 邻接 矩阵 
void showVertex( ); // 显 示 图 的 结 点 
int graphempty( )const{return Vertices.ListEmpty();}  ”// 判 断 图 是 否 为 空 
int numofVertices(){return Vertices. ListSize();} // 求 图 的 结 点 个 数 
int numofEdges(void) {return numofedges; } // 求 图 的 边 数 
char getvalue(const int i); // 求 取 图 中 某 个 结 点 的 值 
int getweight(const int nodestart, const int nodeend);  // 求 两 个 结 点 之 间 的 边 的 权 值 
void insertVertices(const char& vertices); // 向 图 中 添加 一 个 结 点 
int deleteVertex(const int v); // 删 除 一 个 结 点 
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int insertEdge(const int nodestart, const int nodeend, int weight); 


// 添 加 一 条 边 
int deleteEdge(const int nodestart, const int nodeend); // 删 除 一 条 边 
int getfirstneighbor(const int v); // 为 实现 图 的 遍历 而 必须 定义 的 求 


// 取 其 第 一 个 相 邻 结 点 的 函数 
int getnextneighbor(const int nodestart, const int nodeend) ; 
// 求 取 其 下 一 个 相 邻 结 点 的 函数 


void depthfirstsearch(const int v, int visited[ ],void visit(char item)); 


// 深 度 优先 遍历 
void breadthfirstsearch(const int v, int visited[ ], void visit(char item)); 
// 广 度 优先 遍历 
}; 
void graph: : insertVertices(const char& vertices) // 添 加 一 个 结 点 
{ 
Vertices. Insert(vertices, Vertices. ListSize()); // 简 单 起 见 ,把 添加 结 点 放 在 顺序 表 
// 的 最 后 位 置 
} 
int graph: :deleteVertex(const int v) // 删 除 一 个 结 点 
{ 
int i,j; 
for( i=0;i<Vertices.ListSize();i+t+) // 此 轮 考虑 删除 边 ,无 向 图 ,确保 每 
// 条 边 只 删除 一 次 
for( j=0;j<Vertices.ListSize();j++) // 这 里 仅 处 理 上 半边 的 数据 
{ 
if((i==v||j==v) && Edge[i][j]>0 && Edge[i][j]< maxweight && i<j) 
numofedges -一 ; // 有 向 图 边 数 自然 减少 
} 
for( i=v;i<Vertices.ListSize();i++) // 删 除 结 点 必须 把 与 这 个 结 点 相关 
// 联 的 全 部 的 边 首先 删除 
for( j= 0;j< Vertices.ListSize();j++) 
Edge[ i][j] = Edge[i+1][j]; // 移 动 行 的 数据 
for( j=v;j<Vertices.ListSize();j++) // 删 除 结 点 必须 把 与 这 个 结 点 相关 
// 联 的 全 部 的 边 首先 删除 
for( i= 0;i< Vertices.ListSize();i++) 
Edge[ i][j] = Edge[i][j+1]; // 移 动 列 的 数据 
int flag = Vertices. Delete(v); 
if(flag==1) // 提 供 一 个 标志 位 为 后 面 的 调用 方便 
return 1; 
else 
return 0; 
} 
int graph: :insertEdge( const int nodestart, const int nodeend, int weight) 
// 添 加 一 条 边 
{ 
if(nodestart < 0 | | nodestart > Vertices. ListSize( ) | | nodeend < 0 | | nodeend > Vertices. 
ListSize()) 
起 
cout <<" 对 不 起 参数 越界 出 错 !"<< endl; 
return 0; 
} 
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else 


Edge[ nodestart ][ nodeend] = weight; 
Edge[ nodeend][nodestart] = weight; 
numofedges++; // 边 数 增加 一 次 
return 1; 
} 
. 
int graph: :deleteEdge( const int nodestart, const int nodeend)  // 删 除 一 条 边 
{ 
if(nodestart < 0 | | nodestart > Vertices. ListSize ( ) | | nodeend < 0 | | nodeend > Vertices. 
ListSize() ) 
{ 
cout <<" 对 不 起 参数 越界 出 错 !"<< endl; 
return 0; 
} 
else 
{ 
Edge[ nodestart][nodeend] = maxweight; 
Edge[ nodeend] [nodestart] = maxweight; 
numofedges ——; 
return 1; 


} 


上 面 4 个 基本 功能 中 ,增加 结 点 最 为 简单 ,因为 约定 一 律 放 在 最 后 面 ,没有 涉及 数据 移 
动 问题 。 但 是 删除 结 点 就 相对 困难 ,要 把 该 结 点 涉及 的 边 都 删除 ,还 涉及 边 数 的 减少 ,为 了 
保证 正确 性 ,只 处 理 上 三 角 上 边 边 数 的 减少 。 由 于 某 ® 
个 结 点 被 删除 了 ,后 面 的 结 点 都 必须 前 移 , 而 这 个 前 
移 涉及 行 和 列 两 次 。 由 于 是 无 向 图 ,增加 边 和 删除 边 © (2 
的 时 候 都 必须 同时 处 理 两 条 边 。 人 Ca) 

图 9-7 为 上 面 程序 中 默认 数据 对 应 的 无 向 图 。 Cao 

图 9-8 为 程序 运行 后 的 部 分 界面 。 图 9-7 默认 数据 对 应 的 无 向 图 
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(a) 程序 运行 后 的 菜单 (b) 显示 图 的 基础 数据 (Co) 显示 结 点 个 数 和 边 的 个 数 
图 9-8 ”部 分 运行 界面 
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9.4 图 的 链接 存储 


由 于 图 中 任意 结 点 之 间 都 可 以 有 关系 ,n 个 结 点 组 成 的 图 中 每 一 个 结 点 的 度 都 可 以 从 0 
到 n 一 1 ,差别 会 很 大 ,所 以 存储 关系 时 会 遇 到 类 似 树 结构 的 问题 ,或 者 是 链 域 数量 设计 的 不 
够 而 引起 溢出 ,或 者 是 浪费 了 巨大 的 空间 来 存储 全 部 关系 。 由 于 结 点 个 数 本 身 也 是 可 以 变 
化 的 ,所 以 在 增加 新 的 结 点 时 ,即使 浪费 了 极 大 的 空间 还 是 会 遇 到 溢出 问题 。 使 用 链表 来 表 
示 关 系 就 可 以 根据 实际 情况 增加 或 减少 结 点 ,不 会 浪费 过 多 的 存储 空间 。 

邻接 表 (Adjacency List) 是 图 的 一 种 顺序 存储 与 链接 存储 相 结 合 的 存储 方法 。 首 先 定 
义 一 维 结 构 体 数组 , 两 个 域 分 别 是 顶点 域 (vertex) 和 指向 第 一 条 邻接 边 的 指针 域 
(firstedge) ,顶点 域 存储 图 G 中 的 每 个 顶点 vi, 将 邻接 于 w 的 所 有 顶点 vi 依照 某 种 次 序 链 
成 一 个 单 链 表 ,而 表 头 结 点 的 地 址 就 放 在 结构 体 数组 中 的 链 域 中 , 单 链 表 就 称 为 顶点 Vi 的 
邻接 表 , 再 将 所 有 点 的 邻接 表 表 头 地 址 放 在 数组 的 指针 域 中 。 

图 9-9 为 有 向 图 的 邻接 表示 意图 ,除了 上 面 提 到 的 顶点 表 的 结 点 结构 外 , 另 一 种 是 边 表 
( 即 邻接 表 ) 结 点 , 它 由 邻接 点 域 (adjvex) 和 指向 下 一 条 邻接 边 的 指针 域 (next) 构 成 。 由 于 
存储 关系 不 希望 直接 通过 存储 结 点 的 名 称 来 解决 ,所 以 边 表 中 的 数据 域 存储 的 是 迎 辑 上 相 
邻 的 某 个 结 点 在 数组 中 的 地 址 ,虽然 是 以 下 标的 形式 出 现 的 ,但 是 从 原理 上 看 的 确 是 一 个 指 
针 。 从 编程 角度 看 ,形式 上 和 链表 的 指针 写法 有 所 不 同 。 另 外 需要 注意 项 点 表 中 的 结 点 中 
数据 域 存储 的 可 能 是 结 点 名 ,此 处 是 字符 ,而 边 表 中 数据 域 存储 的 是 下 标 , 也 就 是 整数 ,所 以 
需要 通过 联合 体 的 方式 定义 结 点 的 构成 。 下 面 图 示 里 的 顶点 表 的 起 始 下 标 是 从 1 开始 的 ， 
实际 编程 中 约定 从 0 开始 。 
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9-9 有 向 图 的 邻接 表示 意图 


如 果 是 网 图 的 边 表 , 再 增加 一 个 权 值 信息 的 域 (weight) 即 可 。 
【程序 源码 9-2】 下 面 为 邻接 表 存 储 图 构建 部 分 源码 。 


// 图 用 邻接 表 实 现 基本 功能 

# include < windows.h> 

# include < iostream> 

# include < iomanip> 

# include < fstream> 

using namespace std; 

enum returninfo {success, fail, overflow, underflow, nolchild, norchild, nofather, 
havesonl, havesonr, haveason, havetwosons, range_error, quit}; 


// 定 义 返回 信息 清单 
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# define size 21 
int build; 
// 结 点 对 象 设计 
class Node 
public: 
int data; 
Node * next; 
Node( ) 
{ 
this 一 > next = NULL; 
} 
Node( int data, Node * next = NULL) 
{ 
this 一 > data = data; 
this 一 > next = next; 


} 


js 

// 链 表 对 象 设计 

class linklist 

{ 

private: 

Node * head; 

public: 

int length; 

linklist(); 

~linklist(); 

int clearlink(); 

int setheadNULL( ); 

void printlinklist(); 

Node * inserthead( int data); 
Node * insert(int x, int i); 
int getheaddata( ); 

bool del(int data) ; 

Node * find(int value, Node* start); 
Node * find(int value); 

int * nodetoarraydata(); 
int findsmallernunm( int data); 
int getnextnode( int i); 

}; 

// 图 的 邻接 表 对 象 

class ALGraph 

{ 


private: 
linklist * Graph; 
linkqueue queue; 
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// 结 点 个 数 约定 为 20 个 ,从 1 号 地 址 开始 使 用 
// 标 志 位 ,提醒 目前 为 空 表 


// 构 造 结 点 ,指定 元 素 和 后 继 结 点 


// 单 链表 的 头 指针 


// 数 据 个 数 

// 构 造 函 数 

// 析 构 函 数 

// 清 空 链 表 中 的 数据 

// 把 头 结 点 的 链 域 置 空 

// 人 遍历 链表 

// 把 结 点 插入 在 第 一 个 位 置 作为 头 结 点 
// 把 x 值 插入 到 第 并 个 位 置 

// 取 回头 结 点 中 的 值 

// 删 除 值 为 data 的 结 点 

// 从 start 结 点 开始 找 值 为 value 的 结 点 
// 查 找 值 为 value 的 结 点 

// 把 链表 数据 转换 为 数组 数据 

// 找 到 比 data 小 的 数据 个 数 

// 返 回 邻 接 的 下 一 个 结 点 


// 构 造 一 个 链表 的 实例 ,起 名 为 Graph 


// 构 造 一 个 链 队 的 实例 ,起 名 为 queue, 为 广度 优先 遍历 准备 


int nodenumber; 


// 用 于 产生 存放 结 点 的 下 标 位 置 ,同时 记录 结 点 个 数 


int edgenumber; 
int row; 


// 实 际 边 数 记 录 
// 控 制 结 点 数组 的 行 数 
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int i; 

int nodenum, edgenunm; 

int node[ size]; 

int * sortednodes; 

int startpoint, endpoint; 
public: 


ALGraph( int nodenumber = 1, int edgenumber = 0); 


// 循 环 变量 

// 临 时 存储 结 点 数 和 边 数 
// 临 时 存储 图 的 结 点 
// 存 储 排序 后 的 结 点 
// 起 始 结 点 和 终止 结 点 


// 结 点 数组 空置 0 下 标 , 故 nodenumber 从 1 开始 , 边 数 起 始 为 0 


一 ALGraph() 

void inigraph( ); 

void inputdata( void); 

void autocreatgraph( ); 

void showgraph( ); 

void showtotalnodenumber( ); 

void showtotaledgenumber( ); 

int findnode( int nodedata); 

void insertmanynodes( int data); 

// 一 次 插入 一 批 结 点 使 用 的 插入 结 点 函数 
void insertonenode( int data); 

// 一 次 仅 插 入 一 个 结 点 使 用 的 插入 结 点 函数 
int deletenode( int data); 

void insertedge( int startpoint, int endpoint); 
int deleteedge( int startpoint, int endpoint); 
Node * findedge(int startpoint, int endpoint); 
void searchnext( int data); 

void DFSTraverse( ); 


// 深 度 优先 遍历 人 口 


// 图 目前 的 数据 清空 以 备 重新 输入 数据 
// 手 工 输入 数据 

// 启 用 默认 数据 

// 显 示 邻 接 表 

// 显 示 结 点 总 个 数 

// 显 示 边 的 总 个 数 

// 查 找 结 点 在 数组 中 的 行 数 


// 删 除 结 点 
// 插 入 图 的 边 
// 删 除 图 的 边 
// 查 找 两 点 之 间 的 边 
// 查 找 下 一 个 邻接 点 


void TDFSTraverse( int row, int flag[ ], int stackarray[ ]); 


// 深 度 优先 遍历 函数 

void BFSTraverse( ); 

// 广 度 优先 遍历 入 口 

void TBFSTraverse( int row, int flag[ ]); 
// 广 度 优先 遍历 递归 函数 

}; 

void ALGraph: :autocreatgraph( ) 

{ 

int defaultnodenum = 8, 


// 启 用 有 向 图 默认 数据 


defaultnode[ ] = {11, 33, 22, 44, 55, 88,77,66}, 


defaultedgenum = 12, 
defaultedge[12][2] = 
{i122 (1a 
{22,33}, {22,44}, 
{33,88}, 
{44,55}, 
{55, 88}, 
{66,77}, {77,66}, 
{77,44}, 
{88,66}}; 
inigraph( ); 
for (i=0; i<defaultnodenum; i++) 


sortednodes = doquickSort(defaultnode, defaultnodenum) ; 


for (i=0; i<defaultnodenum; i++) 
insertmanynodes( sortednodes[ i]); 
for(i=0;i<defaultedgenum;i++) 
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insertedge(findnode( defaultedge[ i][0]),findnode(defaultedge[ i][1])); 
} 
void ALGraph: : showgraph( ) // 显 示 图 的 邻接 表 形 式 
if(nodenumber == 1) 
cout <<" 目 前 图 没有 数据 !!1!1"<< endl; 
else 
人 
cout <<" 坐 标 "<<" 结 点 名 "<<" 边关 系 链表 "<< endl; 
for(int i=1;i<nodenumber;i++) 
// 此 处 实际 上 从 坐标 1 只 循环 到 达 nodeposition -1 的 坐标 
// 这 正好 是 数据 量 
{ 
Cout <e” "ee Lee 
Graph[ i]. printlinklist(); // 显 示 了 链表 中 的 所 有 数据 
cout << endl; 


} 
} 


图 9-10 为 默认 数据 对 应 的 有 向 图 以 及 邻接 表 基 本 功能 和 数据 显示 运行 图 。 
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(a) 有 向 图 默认 数据 对 应 原 图 (b) 邻接 表 程 序 运行 主 菜单 (c) 显示 邻接 表 所 有 数据 的 效果 
图 9-10 ”邻接 表 基 本 功能 和 数据 显示 运行 图 


上 面 的 程序 中 ,起 始 下 标 用 了 0, 结 点 集 是 按照 字母 序 从 小 到 大 的 , 边 集 的 存储 结构 中 
下 标 也 是 从 小 到 大 排列 的 。 如 果 读 者 的 数据 输入 次 序 和 这 个 一 样 , 则 很 多 操作 的 结果 将 是 
完全 一 样 的 。 

若 无 向 图 中 有 mn 个 顶点 和 e 条 边 , 则 它 的 邻接 表 需 要 n 个 头 结 点 和 2e 个 表 结 点 。 显 然 
在 边 稀 琉 Ce<< n(n 一 1)/2) 的 情况 下 ,用 邻接 表 表 示 图 比邻 接 矩 阵 更 节省 存储 空间 , 当 和 边 
相关 的 信息 较 多 时 更 是 如 此 。 

在 无 向 图 的 邻接 表 中 ,顶点 vi 的 度 恰 为 第 i 个 链表 中 的 结 点 数 ; 而 在 有 向 图 中 ,第 i 个 
链表 中 的 结 点 个 数 只 是 顶点 v 的 出 度 ,为 求人 度 , 必 须 遍 历 整 个 邻接 表 。 在 所 有 链表 中 其 
邻接 点 域 的 值 为 i 的 结 点 的 个 数 是 顶点 vi 的 人 度 。 

为 了 便于 确定 项 点 的 入 度 或 以 顶点 vi 为 头 的 弧 , 可 以 建立 一 个 有 向 图 的 道 邻接 表 , 即 
对 每 个 顶点 vi 建立 一 个 链接 以 vi 为 头 的 弧 的 链表 。 开 发 软件 中 有 时 为 了 某 些 功能 的 高 速 
性 ,会 同时 启用 邻接 表 和 逆 邻 接 表 ,需要 付出 大 量 的 空间 代价 和 维护 成 本 ,一 旦 修改 ,会 涉及 
多 轮 遍 历 , 所 以 开发 中 有 时 需要 考虑 时 空 代价 的 协调 。 下 面 给 出 一 个 实例 。 
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图 9-11 为 一 个 有 向 图 的 逆 邻 接 表 示意 图 。 
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图 9-11 有 向 图 的 逆 邻 接 表示 意图 


在 建立 邻接 表 或 逆 邻 接 表 时 , 若 输 入 的 顶点 信息 为 顶点 的 编号 , 则 建立 邻接 表 的 复杂 度 
为 O(n 十 e); 否则 ,需要 通过 查找 才能 得 到 顶点 在 图 中 的 位 置 , 则 时 间 复 杂 度 为 O(n * e)。 
如 果 同 时 建立 邻接 表 和 逆 邻 接 表 , 对 于 编程 中 实现 各 种 功能 会 提供 便利 ,但 是 付出 了 较 多 的 
空间 代价 和 管理 上 的 时 间 成 本 。 

在 邻接 表 上 容易 找到 任 一 顶点 的 第 一 个 邻接 点 和 下 一 个 邻接 点 ,但 要 判定 任意 两 个 项 
点 (vi 和 vi) 之 间 是 否 有 边 或 弧 相连 , 则 需 搜 索 第 i 个 或 第 j 个 链表 ,因此 不 如 邻接 矩阵 方便 。 

在 邻接 表 存 储 结构 中 ,有 部 分 操作 相 比 邻接 矩阵 会 变 得 比较 复杂 ,如 结 点 的 删除 。 比 如 
有 向 图 ,首先 要 把 其 作为 始点 的 相关 边 删 除 掉 , 这 涉及 单 链 表 的 结 点 删除 和 释放 空间 ,下 一 
步 还 要 把 它 作为 终点 的 相关 边 删 除 掉 , 这 涉及 其 他 所 有 项 点 的 边 的 链表 的 查找 和 删除 结 点 
并 释放 空间 ,最 后 一 步 还 要 通过 数据 的 移动 来 完成 结 点 线性 表 中 对 该 结 点 的 删除 。 如 果 引 
起 部 分 下 标的 变化 ,还 需要 修改 其 他 受到 影响 的 所 有 结 点 信息 ,显然 比邻 接 和 矩阵 付出 了 更 大 
的 时 间 代价 。 

下 面 介绍 其 他 几 种 图 的 存储 方案 。 

十 字 链 表 (Orthogonal List) 是 有 向 图 的 另外 一 种 链表 存储 方法 , 它 实际 上 是 邻接 表 与 
逆 邻 接 表 的 结合 , 即 把 每 一 条 边 的 边 结 点 分 别 组 织 到 以 弧 尾 顶点 为 头 结 点 的 链表 和 以 弧 头 
顶点 为 头顶 点 的 链表 中 。 

图 9-12 为 在 十 字 链 表 表示 中 顶点 表 和 边 表 的 结 点 结构 示意 图 。 在 弧 结 点 中 有 5 个 域 : 
其 中 尾 域 (tailvex) 和 头 域 (headvex) 分 别 指示 弧 尾 和 弧 头 这 两 个 顶点 在 图 中 的 位 置 , 链 域 
hlink 指向 弧 头 相同 的 下 一 条 弧 , 链 域 tlink 指向 弧 尾 相同 的 下 一 条 弧 , weight 域 指向 该 弧 
的 相关 信息 。 弧 头 相 同 的 弧 在 同一 链表 上 , 弧 尾 相同 的 弧 也 在 同一 链表 上 。 它 们 的 头 结 点 
即 为 顶点 结 点 , 它 由 3 个 域 组 成 : 其 中 vertex 域 存储 和 顶点 相关 的 信息 ,如 顶点 的 名 称 等 ; 
firstin 和 firstout 为 两 个 链 域 ,分 别 指 向 以 该 项 点 为 弧 头 或 弧 尾 的 第 一 个 弧 结 点 。 


vertex | firstin | firstout | tailvex | headvex | weight | hlink | tink 
顶点 值 域 指针 域 指针 域 弧 尾 结 点 ” 弧 头 结 点 。” 权 值 指针 域 。 指针 域 
(a) 十 字 链 表 项 点 表 的 结 点 结构 (b) 十 字 链 表 边 表 的 弧 结 点 结构 


图 9-12 ”十字 链 表 表示 中 项 点 表 和 边 表 的 结 点 结构 示意 图 


图 9-13 为 十 字 链 表 的 示意 图 。 若 将 有 向 图 的 邻接 矩阵 看 成 是 稀 下 矩 阵 , 则 十 字 链 表 也 
可 以 看 成 是 邻接 矩阵 的 链表 存储 结构 。 在 图 的 十 字 链 表 中 , 弧 结 点 所 在 的 链表 非 循 环 链表 ， 
结 点 之 间 的 相对 位 置 自然 形成 ,不 一 定 按 顶 点 序号 有 序 , 表 头 结 点 即 顶 点 结 点 ,它们 之 间 不 
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是 顺序 存储 。 从 弧 头 依次 找 边 比较 容易 ,从 弧 尾 依次 找 边 也 比较 容易 .也 容易 求 出 顶点 的 出 
度 和 入 度 , 本 质 上 和 稀 玻 矩阵 的 十 字 链 表 类 似 。 
© 半 1[3115IA 人 TIA 
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图 9-13 ”十字 链表 的 示意 图 


在 十 字 链 表 中 既 容易 找到 以 vi 为 尾 的 弧 ,也 容易 找到 以 vi 为 头 的 弧 , 因 而 容易 求 得 顶 
点 的 出 度 和 入 度 。 同 时 ,由 算法 可 知 ,建立 十 字 链 表 的 时 间 复 杂 度 和 建立 邻接 表 是 相同 的 。 
在 某 些 有 向 图 的 应 用 中 ,十字 链 表 是 很 有 用 的 工具 。 

邻接 多 重 表 (Adjacency Multilist) 作 为 存储 结构 主要 用 于 存储 无 向 图 。 因 为 如 果 用 邻 
接 表 存 储 无 向 图 ,每 条 边 的 两 个 边 结 点 分 别 在 以 该 边 所 依附 的 两 个 项 点 为 头 结 点 的 链表 中 ， 
这 给 图 的 某 些 操作 带 来 不 便 。 例 如 ,对 已 访问 过 的 边 做 标记 ,或 者 要 删除 图 中 某 一 条 边 等 ， 
都 需要 找到 表示 同一 条 边 的 两 个 结 点 。 

邻接 多 重 表 的 存储 结构 和 十 字 链 表 类 似 , 也 是 由 顶点 表 和 边 表 组 成 ,每 一 条 边 用 一 个 结 
点 表示 ,其 顶点 表 结 点 结构 和 边 表 结 点 结构 如 图 9-14 所 示 。 其 中 ,顶点 表 由 两 个 域 组 成 : 
vertex 域 存储 和 该 顶点 相关 的 信息 ,firstedge 域 指示 第 一 条 依附 于 该 顶点 的 边 。 边 表 结 点 
由 6 个 域 组 成 : mark 为 标记 域 ,可 用 于 标记 该 条 边 是 否 被 搜索 过 ; ivex 和 jvex 为 该 边 依 附 
的 两 个 顶点 在 图 中 的 位 置 ; ilink 指向 下 一 条 依附 于 顶点 ivex 的 边 ; jlink 指向 下 一 条 依附 
于 顶点 jvex 的 边 ,weight 为 权 值 域 。 


vertex | firstedge | mark | ivex | ilink | jvex | jlink | weight 
顶点 值 域 指针 域 标记 域 。 顶点 位 置 ”指针 域 。 顶点 位 置 ”指针 域 权 值 
(a) 邻接 多 重 表 中 项 点 结构 (b) 邻接 多 重 表 中 边 结构 


图 9-14 ”邻接 多 重 表 表 示 中 顶点 表 和 边 表 的 结 点 结构 示意 图 


图 9-15 为 邻接 多 重 表 的 示意 图 。 在 邻接 多 重 表 中 ,所 有 依附 于 同一 顶点 的 边 串联 在 同 
一 链表 中 ,由 于 每 条 边 依附 于 两 个 顶点 , 故 每 个 边 结 点 同时 链接 在 两 个 链表 中 。 由 此 可 见 ， 
对 无 向 图 而 言 , 其 邻接 多 重 表 和 邻接 表 的 差别 ,仅仅 在 于 同一 条 边 在 邻接 表 中 用 两 个 结 点 表 
示 , 而 在 邻接 多 重 表 中 只 有 一 个 结 点 。 因 此 ,除了 在 边 结 点 中 增加 一 个 标志 域外 ,邻接 多 重 
表 所 需 的 存储 量 与 邻接 表 相 同 。 在 邻接 多 重 表 上 ,各 种 基本 操作 的 实现 亦 与 邻接 表 相似 。 
对 每 条 边 的 处 理 更 容易 了 ,访问 标记 对 一 些 操作 也 更 方便 了 ,对 无 向 图 更 合适 一 些 , 结 点 个 
数 也 正好 是 边 的 个 数 。 
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图 9-15 ”邻接 多 重 表 的 示意 图 
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9.5 遍历 操作 的 程序 设计 


在 任何 数据 结构 中 ,遍历 都 是 基本 操作 ,许多 操作 都 建立 在 遍历 的 基础 之 上 ,图 也 不 例 
外 。 图 的 遍历 是 指 从 图 中 任 一 顶点 出 发 ,对 图 中 的 所 有 顶点 访问 一 次 且 只 访问 一 次 。 

图 是 一 种 非 线性 结构 ,任意 结 点 间 可 以 有 联系 ,而 且 还 可 能 有 很 多 回路 。 下 面 通过 四 个 
方面 讨论 其 困难 性 : 

(1) 图 结构 不 像 树 结构 ,没有 一 个 “固定 ”的 进入 结 点 ,图 中 任意 一 个 顶点 都 可 作为 第 一 
个 被 访问 的 结 点 , 即 其 遍历 算法 强调 更 强 的 通用 性 。 从 程序 设计 的 角度 ,其 函数 应 该 把 进入 
结 点 名 作为 参数 。 

(2) 在 非 连通 图 中 ,从 某 一 个 顶点 出 发 只 能 访问 它 所 在 的 连通 分 量 上 的 所 有 顶点 ,还 需 
考虑 如 何 访问 图 中 其 余 的 连通 分 量 。 从 程序 设计 的 角度 ,通过 遍历 所 有 结 点 作为 进入 结 点 
解决 这 个 问题 。 

(3) 在 图 结构 中 ,如 果 有 回路 存在 , 需 考虑 一 个 顶点 被 访问 之 后 ,如 何 避 免 沿 某 一 条 路 
又 回 到 该 项 点 重新 访问 。 从 程序 设计 的 角度 ,增加 标志 位 来 区 分 结 点 是 否 被 访问 。 

(4) 在 图 结构 中 ,一 个 项 点 可 以 和 其 他 多 个 顶点 相连 , 当 某 个 顶点 访问 过 后 ,面临 着 许 
多 路 径 , 如 何 选取 下 一 个 要 访问 的 顶点 ,还 有 如 何 确保 访问 剩 下 的 所 有 没有 访问 过 的 结 点 。 
这 个 问题 需要 结合 存储 结构 和 回溯 的 算法 设计 才能 讨论 清楚 。 

图 的 遍历 主要 有 深度 优先 搜索 遍历 和 广度 优先 搜索 遍历 两 种 方式 ,下面 分 别 介绍 。 

1. 深度 优先 搜索 遍历 

深度 优先 搜索 遍历 (Depth_Fisrst Search Trverse, DFS) 类 似 树 的 先 根 遍 历 ,是 树 的 先 
根 遍 历 的 推广 。 

假设 初始 状态 是 图 中 所 有 项 点 未 曾 被 访问 , 则 深度 优先 搜索 可 从 图 中 某 个 顶点 v 出 发 ， 
访问 此 顶点 ,然后 依次 从 v 的 未 被 访问 的 邻接 点 出 发 深度 优先 遍历 图 ,直至 图 中 所 有 和 v 有 
路 径 相通 的 顶点 都 被 访问 到 ; 若 此 时 图 中 尚 有 顶点 未 被 访问 , 则 另 选 图 中 一 个 未 曾 被 访问 
的 顶点 作为 起 始点 ,重复 上 述 过 程 ,直至 图 中 所 有 顶点 都 被 访问 到 为 止 。 

由 于 上 述 讨论 使 用 了 递归 的 定义 ,过 于 抽象 ,下 面相 对 通俗 地 解释 深度 优先 搜索 遍历 
算法 。 

(1) 从 某 个 结 点 出 发 ,访问 ,并 且 把 它 的 访问 标志 从 0 变 成 1, 表示 已 经 访问 过 此 结 点 。 

(2) 从 该 点 选择 第 一 个 对 面 结 点 没有 被 访问 的 路 径 , 到 达 该 结 点 ,访问 ,把 它 的 访问 标 
志 从 0 变 成 1, 并且 重复 (2) ,直到 该 结 点 通路 涉及 的 所 有 结 点 访问 标志 已 经 翻转 为 1, 就 进 
和 步骤 (3) 。 

(3) 从 刚才 的 结 点 开始 回溯 ,退回 到 进入 该 结 点 经 过 的 上 一 个 结 点 ,继续 步骤 (2) 。 

(4) 回溯 的 过 程 一 直 要 到 进入 结 点 ,此 时 如 果 通 路 对 面 涉及 的 所 有 结 点 标志 位 都 已 经 
被 翻转 为 1 时 ,算法 结束 。 

图 9-16 为 无 向 图 的 深度 优先 遍历 示意 图 。 左 边 的 为 一 般 原理 讨论 。 由 于 入 口 的 选择 
是 任意 的 , 故 选择 a 作为 入 口 ,虚线 为 每 一 轮 扫 描 时 的 路 线 , 有 两 个 虚线 的 地 方 为 第 一 次 前 
进 失败 开始 回溯 的 结 点 。 逻 辑 示 意图 上 的 一 次 遍历 结果 为 (a,c,e,i,f,g,d,h,b)。 如 果 是 
在 存储 结构 下 则 根据 存储 的 次 序 选择 下 一 条 边 ,结果 不 一 定 是 这 个 结果 ; 如 果 结 点 名 是 按 
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照 字 母 序 排列 的 , 则 结果 将 是 唯一 的 ,结果 为 (a,b,c,e,i,f,g,d,h)。 布 边 程序 运行 中 默认 
数据 对 应 的 无 向 图 ,在 结 点 名 按 字典 序 的 情况 下 ,从 a 开始 后 ,必然 先 访问 结 点 b, 遍 历 结 果 
仅 为 (a,b,d,f,e,c,g)。 


(a) 原理 讨论 深度 优先 遍历 (b) 程序 默认 数据 深度 遍历 
9-16 无 向 图 的 深度 优先 遍历 示意 图 


对 于 回溯 的 处 理 , 由 于 需要 保存 路 径 明 显 需要 启用 栈 , 即 使 使 用 递归 编程 思路 ,本 质 上 
底层 还 是 要 靠 栈 来 管理 ,所 以 从 这 个 细节 可 以 观察 到 栈 在 程序 设计 中 的 重要 性 。 为 了 在 遍 
历 过 程 中 便于 区 分 顶点 是 否 已 被 访问 ,增加 一 个 访问 标志 数组 visitedL0:n 一 1], 其 初 值 为 
0, 一 旦 某 个 顶点 被 访问 , 则 其 相应 的 值 置 为 1。 

算法 可 以 重新 描述 为 : 

(1) 选择 出 发 结 点 。 

(2) 从 该 结 点 出 发 ,访问 ,把 它 的 访问 标志 从 0 变 成 1 ,并 将 该 结 点 进 栈 。 

(3) 从 该 点 选择 第 一 个 对 面 结 点 没有 被 访问 的 路 径 ,到 达 该 结 点 ,返回 (2) ,直到 该 结 点 
涉及 的 通路 对 面 的 所 有 结 点 的 访问 标志 都 已 经 翻转 为 1, 就 进入 步骤 (4) 。 

(4) 出 栈 , 从 该 结 点 重新 继续 找 一 个 对 面 结 点 没有 被 访问 的 路 径 , 进 入 步骤 (2)。 这 个 
过 程 即 为 回溯 。 

(5) 回溯 的 过 程 一 直 要 回 到 进入 结 点 ,此 时 如 果 通 路 对 面 涉及 的 所 有 结 点 标志 位 都 已 
经 被 翻转 为 1 时 ,算法 结束 。 

下 面 是 以 邻接 矩阵 为 存储 结构 的 递归 深度 优先 遍历 函数 。 


void graph: :depthfirstsearch(const int startpoint, int visited[ ], void visit(char item)) 


// 深 度 优先 遍历 
{ 
int neighborpoint; 
visit(getvalue( startpoint)); // 访 问 结 点 startpoint 
visited[ startpoint] = 1; // 标 记 结 点 startpoint 已 经 被 访问 
neighborpoint = getfirstneighbor( startpoint); // 求 结 点 startpoint 的 第 一 个 邻接 结 点 
while(neighborpoint!= —1) // 当 邻接 结 点 存在 时 循环 


{ 
if(!visited[neighborpoint]) 
depthfirstsearch(neighborpoint, visited, visit); 
// 对 结 点 startpoint 递归 
neighborpoint = getnextneighbor( startpoint, neighborpoint); 
// 结 点 neighborpoint 为 < startpoint, neighborpoint > 邻接 边 的 下 一 个 邻接 结 点 
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程序 运行 部 分 相关 界面 如 图 9-17 所 示 。 


当前 图 的 坐标 和 结 点 如 下 : 
@ 1 3 4 


当前 季 的 邻接 息 狂 如 下 : 
@ DB Co 
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图 9-17 邻接 矩阵 深度 优先 遍历 效果 图 
由 于 图 有 可 能 是 非 连通 的 ,如 果 要 确保 所 有 结 点 都 被 访问 到 ,就 要 注意 必须 以 每 个 点 作 


为 进入 点 进行 遍历 一 次 ,为 了 避免 进入 连通 子 图 遍历 后 对 每 个 结 点 进行 判断 ,就 需要 利用 访 
问 标 志 先 进行 判别 从 而 决定 是 否 开始 某 个 子 图 的 遍历 。 
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下 面 是 以 邻接 表 为 存储 结构 的 深度 优先 遍历 函数 。 


// 深 度 优先 遍历 人口 
void ALGraph: :DFSTraverse() 
{ 
FE 
int *flag= new int [nodenumber]; 
// 结 点 被 访问 标志 ,0 表示 未 被 访问 ,1 表示 已 访问 
for(i=1;i<nodenumber;i+t+) 
// 标 志 位 数组 初始 化 ,全 部 赋值 为 0 
flag[i] =0; 
int * stackarray = new int [nodenumber + 1]; 
// 保 存 路 径 的 数组 ,起 到 栈 的 作用 
for(i= 0;i<nodenumber;i++) // 初 始 状态 全 部 赋值 为 -1 
{ 
stackarray[i] = -1; 
} 
for(i=1;i<nodenumber;i++) 
// 每 一 个 结 点 都 作为 起 始 结 点 一 次 ,确保 非 联通 图 也 可 以 完成 遍历 
if(flag[i] == 0) 
TDFSTraversel( i, flag, stackarray); 
} 


// 深 度 优先 遍历 函数 
void ALGraph: :TDFSTraverse( int row, int flag[ ], int stackarray[ ]) 
{ 
int * adjvexdataarrayl; // 邻 接 边 信息 链表 转换 成 的 数组 
int nextnum; // 下 一 个 邻接 点 的 编号 
int visitednum = 1; // 已 访问 结 点 的 个 数 
//if(row== — 1) return; 
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stackarray[0] = 1; 

//0 号 坐标 中 存放 访问 过 的 结 点 数量 

// 此 处 预 设 为 1, 则 最 后 访问 结 点 数量 需要 减 1 

while(row!= 一 1 && stackarray[0]< nodenumber) 

// 如 果 进 入 点 存在 并 且 已 访问 的 结 点 数量 没有 到 达 总 结 点 量 则 循环 
{ 


if(flag[row] == 0) // 如 果 没 访问 ,就 访问 
{ 
cout << Graph[ row]. getheaddata( )<<" "; // 把 该 编号 对 应 的 结 点 名 输出 
stackarray[ stackarray[0]] = row; // 保 存 路 径 信 息 
stackarray[ 0]++; //stackarray[0] -1 为 存放 已 访问 结 
// 点 个 数 


flag[row] = 1; 
adjvexdataarrayl = Graph[ row]. nodetoarraydata( ); 
// 把 链表 中 所 有 邻接 结 点 信息 转换 成 数组 , 地址 从 1 开始 
nextnum= 1; // 开 始 处 理 第 一 个 相 邻 结 点 
row = Graph[row]. getnextnode( nextnum); 
// 获 取 相 邻 结 点 对 应 在 结 点 数组 中 的 行 号 
while(flag[row] == 1 && row!= — 1 && stackarray[0]< nodenumber) 
// 如 果 该 结 点 被 访问 过 则 查找 下 一 个 邻接 点 


row = adjvexdataarrayl [nextnum++ ]; // 直 到 找到 一 个 没有 被 访问 过 的 结 点 
// 编 号 
visitednum = stackarray[0] -1; // 记 录 已 访问 数据 个 数 


if(stackarray[0]< nodenumber && row== —1) 
// 结 点 没 访问 完 ,同时 相 邻 结 点 都 访问 完毕 


{ visitednum——; // 开 始 回溯 过 程 
row = stackarray[visitednum]; // 从 保存 的 路 径 中 回 退 到 上 一 个 已 访 
// 间 结 点 


} 
图 9-18 为 邻接 表 深 度 优先 遍历 效果 图 。 


表 
JT 4 I 7 41 
-1-25 4 4 


图 9-18 ”邻接 表 深 度 优先 遍历 效果 图 


在 遍历 时 对 图 中 每 个 顶点 至 多 调用 一 次 DFS 函数 ,因为 一 旦 某 个 顶点 被 标志 成 已 被 访 
问 ,就 不 再 从 它 出 发 进行 搜索 。 因 此 遍历 图 的 过 程 实质 上 是 对 每 个 顶点 查找 其 邻接 点 的 过 
程 。 其 耗费 的 时 间 取 决 于 所 采用 的 存储 结构 。 当 用 二 维 数组 表示 图 的 存储 结构 邻接 矩阵 
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时 ,查找 每 个 顶点 的 邻接 点 所 需 时 间 为 O(n?), 其 中 n 为 图 中 顶点 数 。 当 以 邻接 表 作为 图 的 
存储 结构 时 ,查找 邻接 点 所 需 时 间 为 O(e) ,其 中 为 无 向 图 中 边 的 数 或 有 向 图 中 弧 的 数 。 
由 此 可 知 当 以 邻接 表 作 为 存储 结构 时 ,深度 优先 搜索 遍历 图 的 时 间 复 杂 度 为 O(n 十 e)。 

2. 广度 优先 搜索 遍历 

广度 优先 搜索 遍历 (Breadth_First Search Trverse,BFS) 的 编程 思想 类 似 于 树 的 层次 遍 
历 的 过 程 。 

假设 从 图 中 某 顶点 v 出 发 ,在 访问 了 v 之 后 依次 访问 v 的 各 个 未 曾 访问 过 的 邻接 点 , 然 
后 分 别 从 这 些 邻 接点 出 发 依次 访问 它们 的 邻接 点 ,并 使 先 被 访问 的 顶点 的 邻接 点 先 于 后 被 
访问 的 顶点 的 邻接 点 被 访问 ,直至 图 中 所 有 已 被 访问 的 顶点 的 邻接 点 都 被 访问 到 。 若 此 时 
图 中 尚 有 顶点 未 被 访问 , 则 另 选 图 中 一 个 未 曾 被 访问 的 顶点 作为 起 始点 ,重复 上 述 过 程 , 直 
至 图 中 所 有 项 点 都 被 访问 到 为 止 。 换 句 话说 ,广度 优先 搜索 遍历 图 的 过 程 中 以 v 为 起 始点 ， 
由 近 至 远 ,依次 访问 和 v 有 路 径 相通 的 顶点 。 

下 面 更 通俗 地 解释 广度 优先 搜索 遍历 算法 。 

(1) 从 某 个 结 点 出 发 ,访问 ,并 且 把 它 的 访问 标志 从 0 变 成 1, 表示 已 经 访问 过 此 结 点 。 

(2) 选择 所 有 能 从 该 结 点 出 发 的 通路 ,依次 访问 这 些 相 邻 结 点 ,把 它们 的 访问 标志 
从 0 变 成 1。 

(3) 把 第 (2) 步 骤 处 理 过 的 每 一 个 结 点 , 视 同 起 始 结 点 ,重新 开始 步骤 (2) 。 

(4) 直到 全 部 结 点 相当 于 第 一 步骤 的 进入 结 点 一 样 , 都 被 处 理 过 之 后 算法 结束 。 

图 9-19 为 无 向 图 的 广度 优先 遍历 示意 图 。 从 a 进入 ,虚线 代表 每 次 扫描 各 个 边 的 情 
况 。 最 后 的 遍历 结果 为 (a,c,d,b,e,f,g,h,i)。 在 真实 的 存储 结构 下 ,根据 当时 的 存储 次 序 
决定 哪 条 边 先 被 访问 ,结果 也 将 变 为 唯一 。 如 默认 数据 的 图 广度 优先 遍历 结果 仅仅 为 (a,d， 
crdsf,gre)。 

这 个 算法 的 思路 在 实现 时 依然 会 遇 到 困难 ,主要 体现 在 很 多 时 候 在 没有 关系 的 结 点 之 
间 跳 转 。 如 在 图 9-19 中 ,b 之 后 如 何 才 能 到 达 e 呢 ? 


(a) 原理 讨论 广度 优先 遍历 (b) 程序 默认 数据 广度 遍历 
图 9-19 无 向 图 的 广度 优先 遍历 示意 图 


由 于 结 点 之 间 的 处 理 次 序 是 符合 “先进 先 出 ?性质 的 ,答案 就 是 启用 数据 结构 队列 ”, 从 
这 个 细节 可 以 看 到 队列 在 程序 设计 中 的 作用 。 


算法 可 以 重新 描述 为 : 
(1) 从 某 个 结 点 出 发 ,把 该 结 点 入 队 。 
(2) 当 队 列 非 空 时 ,出 队 , 访 问 ,把 它 的 访问 标志 从 0 变 成 1, 表 示 已 经 访问 过 此 结 点 ,并 


且 把 该 结 点 相连 接 的 没有 被 访问 过 的 结 点 依次 进 队 。 
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(3) 反复 进行 步骤 (2)。 直 到 队列 为 空 。 
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下 面 是 以 邻接 矩阵 为 存储 结构 的 非 递 归 广 度 优先 遍历 函数 。 


void graph: :breadthfirstsearch(const int startpoint, int visited[ ], void visit(char item)) 


// 广 度 优先 遍历 
{ 
char getqueuehead, neighborpoint; 
SeqQueue queue; 
visit(getvalue( startpoint)); // 访 问 初始 结 点 startpoint 
visited[ startpoint] = 1; // 标 记 startpoint 已 经 访问 
queue. enqueue( startpoint); // 结 点 startpoint 入 队 
while(!queue. isempty()) // 步 骤 1: 当 队 列 非 空 时 继续 执行 
{ 
getqueuehead = queue. dequeue( ); // 出 队 取 队 头 结 点 getqueuehead 
neighborpoint = getfirstneighbor(getqueuehead); ”// 查 队 头 结 点 的 第 一 个 邻接 结 点 
//neighborpoint 
while(neighborpoint!= —1) // 步 骤 2: 车 结 点 neighborpoint 存 
// 在 则 继续 执行 否则 返回 步骤 1 
{ 
if(!visited[ neighborpoint]) // 若 结 点 neighborpoint 尚未 被 访问 
{ 
visit(getvalue(neighborpoint)); // 访 问 结 点 neighborpoint 
visited[neighborpoint] =1; // 标 记 neighborpoint 已 经 访问 
queue. enqueue( neighborpoint); // 结 点 neighborpoint 入 队 
} 
neighborpoint = getnextneighbor(getqueuehead, neighborpoint); 
// 查 结 点 startpoint, neighborpoint 的 下 一 个 邻接 结 点 为 neighborpoint 返回 步骤 2 
} 
} 


程序 运行 部 分 相关 界面 如 图 9-20 所 示 。 


当前 图 的 坐标 和 结 点 如 下 : 
1 2 3 4 


前 六 的 久 接 算 竹 如 下 : 
a 1 1 Co 
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图 9-20 ”邻接 矩阵 广度 遍历 效果 图 
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分 析 上 述 算法 ,每 个 顶点 至 多 进 一 次 队列 。 遍 历 图 的 过 程 实质 是 通过 边 或 弧 找 邻接 点 
的 过 程 ,因此 广度 优先 搜索 遍历 图 的 时 间 复 杂 度 和 深度 优先 搜索 遍历 相同 ,两 者 不 同 之 处 仅 
在 于 对 顶点 访问 的 顺序 不 同 。 如 果 程 序 内 部 仅 考虑 到 从 某 一 个 结 点 进入 遍历 ,那么 遇 到 了 
非 连通 图 时 ,将 不 会 显示 出 全 部 结 点 。 关 于 这 一 点 可 以 通过 把 每 一 个 标志 位 没有 翻转 过 的 
结 点 都 作为 进入 结 点 循环 处 理 一 遍 即 可 。 

下 面 是 以 邻接 表 为 存储 结构 的 非 递 归 广 度 优先 遍历 函数 。 


// 广 度 优先 遍历 入口 
void ALGraph: :BFSTraverse() 
{ 
int * flag= new int [nodenumber]; 
// 结 点 被 访问 标志 ,0 表示 未 被 访问 ,1 表示 已 访问 
for(int i=1;i<nodenumber;i++) 
// 标 志 位 数组 初始 化 ,全 部 赋值 为 0 
flag[i] =0; 
for(i=1;i<nodenumber; i++) 
// 每 一 个 结 点 都 作为 起 始 结 点 一 次 ,确保 非 连通 图 也 可 以 完成 遍历 
if(flag[i] == 0) 
TBFSTraverse( i, flag); 
} 
void ALGraph: :TBFSTraverse( int row, int flag[ ]) 
// 广 度 优先 遍历 递归 函数 
{ 
int * adjvexdataarray; 
if(flag[row] == 0) 
// 从 row 行 进入 ,代表 着 第 row 个 数据 目前 是 新 的 起 点 ,标志 位 为 0 表示 数据 没有 被 访问 
{ 
cout << Graph[ row]. getheaddata( )<<" "; 
// 取 出 并 显示 第 一 个 结 点 中 的 结 点 名 
flag[row] = 1; // 翻 转 标志 位 
} 
adjvexdataarray = Graph[ row]. nodetoarraydata( ); 
// 把 row 行 结 点 的 所 有 相关 结 点 信息 存 人 一 个 临时 数组 
for(int i=1;i<adjvexdataarray[0];i++) 
//0 号 地 址 中 为 相关 边 的 条 数 , 逐 一 结 点 访问 并 且 进 队 
{ 
if(flag[adjvexdataarray[i]] == 0) 
// 数 据 没 有 被 访问 ,输出 显示 
{ 
cout << Graph[ adjvexdataarray[ i]]. getheaddata( )<<" "; 
flag[adjvexdataarray[i]]=1; 
queue. enqueue(adjvexdataarray[ i]); 
} 
} 
if( (row= queue. dequeue())!= -1) 
// 队 列 不 为 空 ,出 队 产生 出 下 一 个 进入 的 行 坐 标 
{ 
TBFSTraversel( row, flag); 
// 从 新 的 一 行进 入 ,递归 完成 遍历 工作 
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图 9-21 为 邻接 表 广度 优先 遍历 效果 图 。 


图 9-21 邻接 表 广度 优先 遍历 效果 图 


9.6 公路 网 最 短路 径 的 研究 


计算 机 编程 中 经 典 问 题 之 一 是 求 最 短路 径 问 题 。 例 如 在 中 国 的 公路 网 中 ,给 定 了 国内 
的 n 个 城市 以 及 这 些 城市 之 间 相通 公路 的 距离 ,能 否 找 到 城市 A 到 城市 B 之 间 一 条 距离 最 
近 的 通路 ?如 果 将 城市 用 结 点 表示 ,城市 间 的 公路 用 边 表示 ,公路 的 长 度 作为 边 的 权 值 , 那 
么 这 个 问题 就 归结 为 在 网 图 中 求 点 A 到 点 B 的 所 有 路 径 中 边 的 权 值 之 和 最 短 的 一 条 路 径 。 
这 条 路 径 就 是 两 点 之 间 的 最 短路 径 , 并 称 路 径 上 的 第 一 个 顶点 为 源 点 (Sourse) ,最 后 一 个 项 
点 为 终点 (Destination ) 。 

如 果 是 非 网 图 , 求 最 短路 径 可 以 理解 为 求 出 两 点 之 间 经 历 边 数 最 少 的 某 条 路 径 。 

下 面 简要 讨论 两 种 常见 的 最 短路 径 算法 。 

(1) 从 一 个 源 点 到 其 他 各 点 的 最 短路 径 问 题 。 给 定 带 权 有 向 图 G 二 (VSET,E) 和 源 点 
vE VSET, 求 从 v 到 G 中 其 余 各 顶点 的 最 短路 径 。 在 下 面 的 讨论 中 假设 源 点 为 w 。 

(2) 迪 杰 斯 特 拉 (Dijkstra) 方 法 。 这 是 一 个 按 路 径 长 度 递增 的 次 序 产生 最 短路 径 的 算 
法 。 该 算法 的 基本 思想 是 : 设置 两 个 顶点 的 集合 S 和 T=VSET 一 S, 集 合 S 中 存放 已 找到 
最 短路 径 的 顶点 ,集合 工 存 放 当 前 还 未 找到 最 短路 径 的 顶点 。 

初始 状态 时 ,集合 S 中 只 包含 源 点 vo ,然后 不 断 从 集合 T 中 选取 到 顶点 vo 路 径 长 度 最 
短 的 顶点 u, 加 入 集合 S 中 ,集合 S 中 每 加 入 一 个 新 的 顶点 u, 都 要 修改 顶点 vo 到 集合 工 中 
剩余 顶点 的 最 短路 径 长 度 值 , 集 合 工 中 各 顶点 新 的 最 短路 径 长 度 值 为 原来 的 最 短路 径 长 度 
值 与 顶点 u 的 最 短路 径 长 度 值 加 上 u 到 该 顶点 的 路 径 长 度 值 中 的 较 小 值 。 

此 过 程 不 断 重 复 ,直到 集合 工 的 顶点 全 部 加 入 S 中 为 止 。Dijkstra 算法 的 正确 性 可 以 
用 反 证 法 加 以 证 明 。 假 设 下 一 条 最 短路 径 的 终点 为 x, 那 么 ,该 路 径 必 然 或 者 是 弧 (vo,x)， 
或 者 是 中 间 只 经 过 集合 S 中 的 顶点 而 到 达 顶 点 x 的 路 径 。 因 为 假若 此 路 径 上 除 x 之 外 有 一 


径 还 短 的 路 径 , 这 与 按 路 径 长 度 递增 的 顺序 产生 最 短路 径 的 前 提 相 矛盾 ,所 以 此 假设 不 
成 立 。 

下 面 介 绍 Dijkstra 算法 的 实现 。 首 先 , 引进 一 个 辅助 数组 DISTANCE, 它 的 分 量 
DISTANCE[i 订 表示 当前 所 找到 的 从 始点 v 到 每 个 终点 vi 的 最 短路 径 的 长 度 。 它 的 初 态 
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为 : 车 从 v 到 vi 有 统 , 则 DISTANCE[i] 为 弧 上 的 权 值 ; 否则 置 DISTANCE[i 为 cc 。 显 然 ， 
长 度 为 : 
DISTANCE[j] = Min{DISTANCE[i] | wE VSET'} 
的 路 径 就 是 从 v 出 发 的 长 度 最 短 的 一 条 最 短路 径 。 此 路 径 为 (v,vi)。 那 么 ,下 一 条 长 度 次 
短 的 最 短 是 哪 一 条 呢 ? 假 设 该 次 短路 径 的 终点 是 w ,这 条 路 径 或 者 是 (v,vi) ,或 者 是 (v,vi， 
Vv )。 它 的 长 度 或 者 是 从 v 到 vi 的 弧 上 的 权 值 , 或 者 是 DISTANCE[j] 和 从 vi 到 vs 的 弧 上 
的 权 值 之 和 。 依 据 前 面 介绍 的 算法 思想 ,在 一 般 情 况 下 ,下 一 条 长 度 次 短 的 最 短路 径 的 长 度 
必 是 : 
DISTANCE[j] = Min{DISTANCE[i] | v € VSET-S} 
其 中 ,DISTANCE[i] 或 者 是 弧 (v,v;) 上 的 权 值 ,或 者 是 DISTANCE[k](ve ES) 和 弧 (vi,vi) 
上 的 权 值 之 和 。 
根据 以 上 分 析 , 可 以 得 到 如 下 描述 的 算法 : 
(1) 假设 用 带 权 的 邻接 矩阵 edges 来 表示 带 权 有 向 图 ,edges[ 让 0] 表示 弧 (vi;,v;) 上 的 权 
值 。 若 (vi,vi) 不 存在 , 则 置 edges[i[j] 为 (在 计算 机 上 可 用 允许 的 最 大 值 代替 或 负数 )。 
S 为 已 找到 从 v 出 发 的 最 短路 径 的 终点 的 集合 , 它 的 初始 状态 为 空 集 。 那 么 ,从 v 出 发 到 图 
上 其 余 各 顶点 (终点 )vi 可 能 达到 最 短路 径 长 度 的 初 值 为 : 
DISTANCE[i]=edges[LocateVex(G,v)J[i] vi€EVSET 
(2) 选择 vj ,使 得 
DISTANCE[j]= Min{DISTANCE[i]|v.E VSET—S} 
vi 就 是 当前 求 得 的 一 条 从 v 出 发 的 最 短路 径 的 终点 。 令 
S=SU 1{j) 
(3) 修改 从 v 出 发 到 集合 VSET-S 上任 一 顶点 w 可 达 的 最 短路 径 长 度 。 如 果 
DISTANCE[j] 十 edges[j][k]<DISTANCE[Lk] 
则 修改 DISTANCE[k] 为 
DISTANCE[k]=DISTANCE[j]+edges[Lj]J[k] 
重复 操作 (2)、(3) 共 n 一 1 次 。 由 此 求 得 从 v 到 图 上 其 余 各 顶点 的 最 短路 径 是 依 路 径 长 度 递 
增 的 序列 。 
图 9-22 为 一 个 无 向 网 图 的 范例 .对 应 的 带 权 邻接 矩阵 以 及 最 短路 径 示 意图 。 


(a) 无 向 图 网 (b) 带 权 邻接 矩阵 (©) a 到 各 结 点 的 最 短路 径 
图 9-22 ”一 个 无 向 网 图 及 其 邻接 矩阵 示意 图 


车 对 图 9-22 中 的 无 向 网 图 施行 Dijkstra 算法 , 则 可 得 到 a 到 其 余 各 顶点 的 最 短路 径 ， 
图 9-22(c) 显 示 了 最 终结 果 相 关 的 一 些 边 。 可 以 看 出 ,开始 时 结 点 a 是 不 能 到 达 b 的 ,但 是 
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在 第 二 轮 增加 结 点 b 后 , 结 点 a 可 以 通过 结 点 < 抵达 结 点 b 了 ,最 短路 径 从 == 变 成 了 15。 同 
理 , 结 点 a 到 结 点 原来 可 以 抵达 , 权 值 为 100, 在 逐次 加 入 其 他 结 点 后 ,最 短路 径 最 终 变 为 60。 
【程序 源码 9-3】 求 最 短路 径 问 题 部 分 源码 。 


void graph: :dodijkstra( ) // 启 动 最 短路 径 函 数 的 人口 
int x* distance 
inputnodenum = numofVertices(); // 取 回 结 点 个 数 
distance = new int[ inputnodenum]; // 距 离 数 组 
path = new int[ inputnodenum]; // 路 径 数组 


cout << "下 面 开 始 求 某 个 结 点 到 其 他 结 点 的 最 短 距离 …" << endl; 
cout << "请 输入 结 点 编号 : " << 0 << "一 " << inputnodenum - 1 << endl; 


// 提 示 给 定 入 口 
cin >> vO; // 给 定 入 口 
if (v0 >= 0 && vO <= inputnodenum) // 结 点 编号 参数 正确 
{ 
dijkstra(vO, distance, path); // 调 用 实际 最 短路 径 函 数 
cout << "从 结 点 " << getvalue(v0) << "到 其 他 各 结 点 的 最 短 距离 为 :" << endl; 
for (i = 0; i< inputnodenum; i++) 
if (distance[i] == 10000) 
cout << "到 结 点 "<< getvalue(i) << "的 最 短 距离 为 : ®%" << endl; 
else 
cout << "到 结 点 " << getvalue(i) << "的 最 短 距离 为 :" << distance[ i] << endl; 
cout << endl; 
cout << "寻找 路 径 如 下 :" << endl; 
cout << "从 结 点 " << getvalue(v0) << "到 其 他 各 结 点 最 短路 径 的 上 一 个 结 点 为 :" << endl; 
for (i = 0; i< inputnodenum; i++) 
{ 
if (path[i] != -1) 
cout << "到 结 点 " << getvalue(i) << "的 上 一 个 结 点 为 :" << getvalue(path[i]) << 
endl; 
} 
} 
else 
{ 
cout << "对 不 起 ! 结 点 参数 出 错 ! 按 任意 键 继续 …… " < endl; 
} 


} 
void graph: :dijkstra( int v0, int distance[ ]，int path[]) 
// 求 最 短路 径 函 数 ,参数 : 起 点 ,距离 数组 .路 径 数 组 


{ 
int inputnodenum; 
inputnodenum = numofVertices(); // 取 回 结 点 个 数 
int * mark = new int[inputnodenum]; // 标 志 位 数组 
int mindis, nextnode; // 最 短路 径 , 下 一 个 结 点 
i // 循 环 变量 
for (i = 0; i< inputnodenum; i++) // 初 始 化 
{ 
distance[i] = getweight(v0, i); // 第 一 轮 距离 数组 记录 从 起 始点 到 
// 其 他 所 有 点 的 边 权 值 
mark[i] = 0; // 所 有 标志 位 清 零 
证 (i != vO && distance[i] < maxweight) // 如 果 起 始 结 点 可 以 抵达 某 个 结 点 
path[i] = vo; // 则 把 该 结 点 首先 放 入 路 径 数组 
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else 
path[i] = 一 1 // -1 代表 该 路 径 不 通 
} 
mark[v0] = 1; // 把 起 点 的 标志 位 翻转 为 1 
for (i = 1; i< inputnodenum; i++) 
// 在 还 没有 找到 最 短路 径 的 结 点 集合 中 选取 最 短 距离 结 点 nextnode 
{ 


mindis = maxweight; // 首 先 约定 最 小 距离 为 无 穷 大 
for (j = 0; j <= inputnodenum; j++) // 扫 描 其 他 所 有 点 
证 (mark[j] == 0 && distance[j] < mindis) // 如 果 没 有 进入 最 短路 径 且 距离 小 
// 于 最 小 距离 
{ 
nextnode = j; // 记 录 本 次 边 对 面 的 点 
mindis = distance[j]; // 记 录 本 次 最 短路 径 
} 
} 
if (mindis == maxweight) // 当 不 存在 路 径 时 算法 结束 
{ 
return; 
} 
mark[nextnode] = 1; // 标 记 结 点 nextnode 已 经 放 到 了 找 
// 到 最 短路 径 的 集合 中 
for (j = 0; j < inputnodenum; j++) // 修 改 结 点 v0 到 其 他 的 结 点 最 短 的 
// 距 离 


{ 
if (mark[j] == 0 && getweight(nextnode, j) < maxweight 
&& distance[ nextnode] + getweight(nextnode, j) < distance[j]) 


// 发 现 新 的 最 短路 径 
{ 
distance[j] = distance[nextnode] + getweight(nextnode, j); 
// 刷 新 最 短路 径 
path[j] = nextnode; // 把 该 点 加 入 路 径 


上 
图 9-23 为 图 的 最 短路 径 功 能 演示 程序 运行 图 。 
se 
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图 9-23 图 的 最 短路 径 功能 演示 程序 运行 图 
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由 于 算法 内 部 核心 为 双重 循环 ,所 以 这 个 算法 的 时 间 复 杂 度 是 O(n?)。 

如 果 仅 需要 求 出 特定 两 个 结 点 之 间 的 最 短路 径 , 那 么 只 需要 简单 修改 上 面 的 程序 即 可 。 如 
果 要 一 次 性 求 出 每 一 对 顶点 之 间 的 最 短路 径 , 则 可 以 用 下 面 的 思路 。 每 次 以 一 个 顶点 为 源 点 , 重 
复 执行 迪 杰 斯 特 拉 算 法 n 次 ,这样 便 可 求 得 每 一 对 顶点 的 最 短路 径 。 总 的 执行 时 间 为 O(n ) 。 

下 面 介绍 由 弗 洛 伊 德 (Floyd) 提 出 的 另 一 个 算法 。 这 个 算法 的 时 间 复 杂 度 也 是 O(m ) ,但 
计算 过 程 比较 简单 。 弗 洛 伊 德 方法 仍 从 图 的 带 权 邻 接 和 矩阵 weight 出 发 ,其 基本 思想 如 下 : 

假设 求 从 顶点 w 到 Wi 的 最 短路 径 。 如 果 从 vi 到 本 有 弧 , 则 从 vi 到 Vi 存在 一 条 长 度 为 
edges[iJ[j] 的 路 径 , 该 路 径 不 一 定 是 最 短路 径 , 尚 需 进行 n 次 试探 。 首 先 考虑 路 径 (v;， vo， 
vw) 是 否 存 在 ( 即 判 别 弧 (v;, veo) 和 (vo, vi) 是 否 存 在 )。 如 果 存 在 , 则 比较 (vi, vj) 和 (vi, vo， 
vv) 的 路 径 长 度 , 取 长 度 较 短 者 为 从 vi; 到 v 的 中 间 顶 点 的 序号 不 大 于 0 的 最 短路 径 。 

假如 在 路 径 上 再 增加 一 个 顶点 vi ,也 就 是 说 ,如 果 (vi,，…, vi) 和 (vi,，…, vi) 分 别 是 当 
前 找到 的 中 间 顶 点 的 序号 不 大 于 0 的 最 短路 径 , 那 么 (vi;,，…, v1,，… ,vi) 就 有 可 能 是 从 vi 
到 v 的 中 间 顶 点 的 序号 不 大 于 1 的 最 短路 径 。 将 它 和 已 经 得 到 的 从 vi 到 w 中 间 顶 点 序号 
不 大 于 0 的 最 短路 径 相 比 较 , 从 中 选 出 中 间 顶 点 的 序号 不 大 于 1 的 最 短路 径 之 后 ,再 增加 一 
个 顶点 v; ,继续 进行 试探 。 依 此 类 推 。 在 一 般 情 况 下 , 若 (vi，…,， ve) 和 (ve，…, vi) 分 别 是 
从 到 Vv 和 从 vi 到 vi 的 中 间 顶 点 的 序号 不 大 于 一 1 的 最 短路 径 , 则 将 (vi …， ve，…， 
vi) 和 已 经 得 到 的 从 v; 到 w 且 中 间 顶 点 序号 不 大 于 k 一 1 的 最 短路 径 相 比较 ,其 长 度 较 短 者 
便 是 从 w 到 vi 的 中 间 顶 点 的 序号 不 大 于 k 的 最 短路 径 。 这 样 , 在 经 过 m 次 比较 后 ,最 后 求 
得 的 必 是 从 v; 到 vj 的 最 短路 径 。 

按 此 方法 ,可 以 同时 求 得 各 对 顶点 间 的 最 短路 径 。 现 定义 一 个 n 阶 方 阵 序列 。 

D-DD DV DP DY 
其 中 
DT [0]=edges[Lij[0j] 
D' ?C0]=Min(D ?C0], DP CCkJ+D ?Ck oo<k<n—1l 

从 上 述 计算 公 式 可 见 ,D [iD 是 从 vi 到 v 的 中 间 顶 点 的 序号 不 大 于 1 的 最 短路 径 的 长 
度 ; D'*[]0] 是 从 w 到 六 的 中 间 顶 点 的 个 数 不 大 于 k 的 最 短路 径 的 长 度 ; D" [iD] 就 
是 从 vi 到 vi 的 最 短路 径 的 长 度 。 


9.7 AOV 网 与 拓扑 排序 


在 管理 工作 中 经 常会 处 理 一 些 大 型 项 目 , 其 中 涉及 很 多 子 项 目 , 可 以 称 为 活动 ,这 些 活 
动 之 间 总 有 一 些 先 后 次 序 必 须 处 理 好 ,否则 就 会 带 来 不 必要 的 资源 浪费 或 麻烦 。 

AOV 网 (activity on vertex network) 所 有 的 工程 或 者 某 种 流程 都 可 以 分 为 若干 小 的 工 
程 或 阶段 ( 称 为 活动 ) 。 若 以 图 的 顶点 来 表示 活动 .有 向 边 表示 活动 之 间 的 先后 次 序 , 则 活动 
在 顶点 上 的 有 向 图 称 为 AOV 网 。 

在 AOV 网 中 , 若 从 顶点 i 到 顶点 j 之 间 存 在 一 条 有 向 路 径 , 称 项 点 i 是 项 点 j 的 前 趋 ， 
或 者 称 顶 点 j 是 顶点 i 的 后 继 。 若 <i,j > 是 图 中 的 弧 , 则 称 顶 点 i 是 顶点 j 的 直接 前 趋 ,顶点 j 
是 顶点 i 的 直接 后 继 。 由 于 活动 之 间 有 先后 关系 ,所 有 的 边 都 是 有 向 边 ,所 以 启用 有 向 图 来 
处 理 AOV 网 。 
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下 面 通过 一 个 实例 来 说 明 AOV 网 的 工作 原理 。 如 计算 机 相关 专业 的 学 生 在 大 学 里 必 
须 完成 一 系列 规定 的 基础 课 和 专业 课 才 能 毕业 ,这 些 课 程 是 否 可 以 按照 随意 的 次 序 进 行 学 
习 呢 ? 显然 不 行 , 因 为 很 多 课程 的 内 容 是 另外 一 门 课程 的 基础 。 如 果 不 先 学 习 先 导 课 程 ,就 
会 导致 后 继 某 门 课程 很 难 学 懂 。 整 个 学 习 过 程 可 以 看 成 是 一 个 大 工程 ,其 活动 就 是 学 习 每 
一 门 课程 。 下 面 选 择 了 一 部 分 课程 作为 范例 ,把 先后 关系 用 有 向 图 表达 出 来 。 

图 9-24 是 AOV 网 在 课程 次 序 安排 中 的 范例 的 示意 图 ,C 语言 和 离散 数学 是 独立 于 其 
他 课程 的 基础 课 ,而 其 他 课程 却 需要 有 先导 课程 ,如 ,学 完 C++ 和 数据 结构 后 才能 学 操作 系 
统 。 用 顶点 表示 课程 ,有 向 边 表示 前 提 条 件 。 箭 头 方向 表示 了 课程 之 间 的 逻辑 先后 次 序 。 
若 课程 i 为 课程 j 的 先导 课 , 则 必然 存在 有 向 边 < i,j >。 在 安排 课程 次 序 时 ,必须 保证 在 学 
习 某 门 课程 之 前 ,已 经 学 习 了 其 先导 课程 。 


9-24 AOV 网 在 课程 次 序 安排 中 的 范例 


AOV 网 的 例子 还 有 很 多 ,如 计算 机 程序 ,任何 一 个 可 执行 程序 可 以 划分 为 若干 程序 段 
(或 若干 语句 ) ,由 程序 段 组 成 的 流程 图 也 是 一 个 AOV 网 。 

为 了 保证 该 项 工程 得 以 顺利 完成 ,必须 保证 AOV 网 中 不 出 现 回路 ; 否则 ,意味 着 某 项 
活动 会 以 自身 作为 能 否 进行 的 前 提 , 这 是 不 可 能 的 。 在 程序 设计 或 运行 中 这 就 是 “ 死 锁 ” 的 
范例 。 在 操作 系统 课程 中 会 有 深入 的 讨论 。 

测试 AOV 网 是 否 具 有 回路 的 方法 ,就 是 在 AOV 网 的 偏 序 集合 下 构造 一 个 线性 序列 ， 
该 线性 序列 具有 以 下 性 质 : 

加 在 AOV 网 中 , 若 顶点 i 优先 于 顶点 j, 则 在 线性 序列 中 顶点 i 仍然 优先 于 顶点 j 。 

@ 对 于 网 中 原来 没有 优先 关系 的 顶点 i 与 顶点 j, 在 线性 序列 中 也 建立 一 个 先后 关系 ， 
或 者 顶点 i 优先 于 顶点 j, 或 者 顶点 j 优先 于 i。 

满足 以 上 性 质 的 线性 序列 称 为 拓扑 有 序 序列 。 构 造 拓扑 序列 的 过 程 称 为 拓扑 排序 。 也 
可 以 说 拓扑 排序 就 是 由 某 个 集合 上 的 一 个 偏 序 得 到 该 集合 上 的 一 个 全 序 的 操作 。 

拓扑 排序 就 是 把 非 线性 结构 转换 为 一 种 线性 结构 ,其 中 任何 结 点 之 间 的 关系 依然 符合 
原 有 向 图 之 间 的 先后 约束 关系 。 

若 某 个 AOV 网 中 所 有 项 点 都 在 它 的 拓扑 序列 中 , 则 说 明 该 AOV 网 不 存在 回路 ,这 时 
的 拓扑 序列 集合 是 AOV 网 中 所 有 活动 的 一 个 全 序 集合 。 

以 图 9-24 为 例 ,一 个 拓扑 序列 如 下 : C 语言 离散 数学 .C++ 语言 .数据 结构 .计算 机 原 
理 、 计 算 方法 、 操 作 系统 、 编 译 系统 、 网 站 制作 、Linux 解析 、 软 件 工程 .网 络 原理 、 数 据 库 原 
理 、 数 据 库 实现 .毕业 设 计 。 

拓扑 排序 算法 的 步骤 如 下 : 
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@ 从 网 中 删除 该 顶点 ,并且 删 除 从 该 顶点 发 出 的 全 部 有 向 边 ( 程 序 设计 中 可 以 通过 其 
他 机 制 如 标志 位 等 来 处 理 ,不 一 定 是 真正 的 删除 操作 ) 。 
@ 重复 上 述 两 步 ,直到 剩余 的 网 中 不 再 存在 没有 前 趋 的 顶点 为 止 。 
操作 的 结果 有 两 种 : 一 种 是 网 中 全 部 顶点 都 被 输出 ,这 说 明 网 中 不 存在 有 向 回路 ; 另 
一 种 就 是 网 中 顶点 未 被 全 部 输出 ,这 说 明 网 中 存在 有 向 回路 。 
在 算法 设计 中 可 设置 一 个 标志 位 数组 ,凡是 网 中 入 度 为 0 的 顶点 都 翻转 为 1, 并 且 通 过 
记录 最 后 输出 的 结 点 个 数 来 确定 是 否 有 环 路 。 
对 一 个 具有 nm 个 顶点 和 e 条 边 的 网 来 说 ,整个 算法 的 时 间 复 杂 度 为 O(e 十 n)。 
程序 默认 数据 代表 的 无 环 有 向 图 以 及 相关 数据 如 图 9-25 所 示 。 
02 
03 
3 
14 
党 昭 
3.5 
46 
$F 
68 
69 
7 10 
8 10 
9 10 
(a) AOV 网 范例 (b) 结 点 对 应 编号 (e) 有 向 边 基 础 数据 (d) 拓扑 排序 结果 


图 9-25 AOV 网 范例 以 及 基础 数据 和 运行 结果 
【程序 源码 9-4】 拓扑 排序 部 分 源码 ,存储 结构 采用 邻接 矩阵 。 为 了 兼容 带 权 图 ,文本 
文件 中 的 权 值 数据 全 部 赋值 为 1 即 可 。 


// 拓 扑 排序 函数 
void graph: :topological() 


(a b, c,d, €, f, g, h, i,j, k) 


Ce 


int tempcount; // 临 时 计数 器 
for(j= 0;j< inputnodenum;j++) // 求 所 有 结 点 的 入 度 , 从 每 一 列 开始 扫描 , 然 
// 后 看 哪 一 行进 入 
{ 
tempcount = 0; // 本 次 临时 计数 器 记录 每 一 列 中 1 的 个 数 
for(i= 0;i< inputnodenum; i++) // 列 优先 扫描 
if(getweight(i,j) ==1) 
tempcount++; // 两 点 通达 则 入 度 加 1 
Indegree[ j] = tempcount; // 每 一 列 统计 完毕 后 存 人 人 度数 组 的 下 标 
// 位 置 


cout << endl <<" 所 有 结 点 人 度 如 下 :"<< endl; // 显 示 入 度 信 息 
for(j=0;j< inputnodenum; j++) 

cout << nodesarray[ j]<<" = >"<< Indegree[j]<<" "; 
cout << endl; 
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tempcount = 0; 
// 本 次 临时 计数 器 记录 逻辑 删除 点 的 个 数 ,同时 正好 等 于 进入 拓扑 排序 结果 数组 的 下 标 控制 变量 


for(i=0;i< inputnodenum; i++) // 从 每 一 个 结 点 开始 检测 
if( (Indegree[i] == 0) && (deleflag[i] == 0)) // 入 度 为 0 和 删除 标记 为 0 的 顶点 
{ 
topologicalSort[ tempcount] = i; // 输 出 到 结果 数组 中 
tempcount++; // 计 数 器 加 1, 同时 为 下 标 
for(j= 0;j< inputnodenum; j++) // 逻 辑 上 删除 该 点 后 ,每 一 列 扫描 一 次 
if(getweight(i,j) ==1) // 如 果 发 现 该 列 的 该 行 原来 为 1 
Indegree[j] ——; // 在 入 度数 组 中 将 该 结 点 的 入 度 减 1 
deleflag[i] =1; // 在 删除 标记 数组 中 将 该 结 点 删除 标记 翻 
// 转 为 1 
i 
if(tempcount == inputnodenum) // 如 果 全 部 结 点 都 进入 了 拓扑 序列 ,说 明 该 
// 有 向 图 没有 环 路 
{ 


cout << endl <<" 有 向 图 的 拓扑 序列 为 : "<< endl; // 输 出 拓扑 序列 
for(i= 0;i< inputnodenum; i++) 
if(i== inputnodenum— 1) 
cout <<"["<< nodesarray[ topologicalSort[i]]<<"]"; 


// 最 后 一 个 结 点 
else 
cout <<"["<< nodesarray[ topologicalSort[i]]<<"]"<<"—"; 
// 中 间 结 点 
cout << endl; 
else 


cout <<" 本 有 向 图 不 存在 拓扑 序列 , 有 环 路 存在 !"<< endl; 


程序 运行 后 的 部 分 相关 界面 如 图 9-26 所 示 。 


888888a88-8 。» 
88888s8-r88 no 
8888a8-8888 an 
888s8-88888 -=~ 
88a8-8838888 -oe 
8a88-888888 -~ 
arrr8888888 xs 


a 
和 
1 

cp 
9 

oo 

op 

oo 

oo 

co 

co 

oo 


ar-?2 e=)1 f=?22 gH ha i j= k=2?3 


序列 为 : 


[qd 一 [el][f]->[g]->[h]->[i[j]->[k] 


图 9-26 有 向 图 拓扑 排序 求解 程序 运行 图 
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9.8 最 小 代价 生成 树 的 研究 


9.8.1 最 小 生成 树 的 定义 


电话 通信 网 可 以 把 多 个 城市 联系 在 一 起 ,但 是 如 何以 尽 可 能 低 的 总 造价 建造 这 个 网 呢 ? 
假设 这 些 城市 中 任意 两 个 城市 之 间 都 可 以 建造 通信 线路 ,通信 线路 的 造价 依据 城市 间 的 距 
离 不 同 而 不 同 ,那么 就 可 以 构造 一 个 通信 线路 造价 网 图 ,每 个 顶点 表示 城市 ,顶点 之 间 的 边 
表示 城市 之 间 可 构造 通信 线路 ,每 条 边 的 权 值 表 示 该 条 通信 线路 的 造价 ,要 使 总 造价 最 低 ， 
实际 上 就 是 寻找 该 网 图 的 最 小 代价 生成 树 。 

最 小 代价 生成 树 (MiniSpanTree, 又 称 为 MST) 的 定义 : 如 果 无 向 连通 图 是 一 个 网 图 ， 
那么 它 所 有 生成 树 中 必 有 一 棵 生成 树 ; 其 边 的 权 值 总 和 最 小 ,那么 称 这 棵 生成 树 为 最 小 代 
价 生成 树 ,简称 为 最 小 生成 树 。 

由 生成 树 的 定义 可 知 ,无 向 连通 图 的 生成 树 并 不 唯一 。 例 如 可 以 通过 连通 图 的 遍历 法 
把 所 经 过 边 的 集合 及 图 中 所 有 顶点 的 集合 构成 该 图 的 一 棵 生成 树 , 那 么 对 连通 图 进行 不 同 
的 遍历 方法 ,就 可 以 得 到 不 同 的 生成 树 。 可 以 证 明 , 对 于 有 n 个 顶点 的 无 向 连通 图 ,无 论 其 
生成 树 的 形态 如 何 ,所 有 生成 树 中 都 有 且 仅 有 n 一 1 条 边 。 

通常 程序 设计 中 最 容易 采用 的 编程 方式 为 “穷尽 法 ”, 就 是 利用 计算 机 的 高 速 性 遍历 所 
有 可 能 ,然后 根据 要 求 求 出 符合 条 件 的 结果 即 可 ,但 是 本 数据 模型 使 用 这 个 方法 是 失败 的 ， 
因为 一 个 图 的 所 有 连通 子 图 数量 是 非常 多 甚至 无 穷 个 ,全 部 求 出 来 过 于 耗 时 。 这 时 可 以 采 
用 另外 一 种 编程 方法 ,就 是 “构造 法 ”。 它 的 思路 就 是 通过 某 种 算法 直接 求 出 一 个 结果 ,而 这 
个 结果 可 以 证 明 是 符合 条 件 的 那 一 个 。 

下 面 分 别 介绍 两 种 构造 最 小 生成 树 的 方法 : Prim 算法 ( 普 里 姆 算法 )、Kruskal 算法 ( 克 
鲁 斯 卡尔 算法 ) 。 

图 9-27 为 无 向 连通 图 的 生成 树 范例 示意 图 ,前 两 棵 树 为 对 图 9-14 中 左边 的 图 进行 深 
度 遍 历 和 广度 遍历 后 产生 的 生成 树 ,然后 是 一 个 随意 画 出 的 一 个 生成 树 ,最 右边 为 一 个 带 权 
连通 无 向 图 的 范例 ,也 对 应 着 下 面 程序 运行 时 读 人 的 默认 数据 。 


ss 


(a) 深度 遍历 生成 树 (b) 广度 遍历 生成 树 (0) 随意 的 一 棵 生成 树 (d) 带 权 连 通 无 向 图 范例 
图 9-27 无 向 连通 图 的 生成 树 范例 示意 图 


本 程序 存储 结构 采用 邻接 矩阵 ,可 以 随时 显示 该 矩阵 的 所 有 值 。 

Prim 算法 和 Kruskal 算法 是 两 种 寻找 网 图 最 小 生成 树 的 算法 。 为 了 把 结果 保存 下 来 ， 
启用 了 指针 数组 : linklist list[4]; 分 别 用 0、1 下 标 指向 Prim 算法 初始 链表 和 最 终结 果 链 
表 ,2、3 下 标 指向 Kruskal 算法 的 初始 链表 和 最 终结 果 链 表 。 主 要 的 Prim 算法 和 Kruskal 
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算法 的 源码 实现 放 在 下 面 讨 论 原理 时 分 别 给 出 ,这 里 给 出 的 主要 是 数据 读 入 和 显示 邻接 矩 
阵 等 函数 ,其 他 的 如 结 点 或 边 的 增加 、 删 除 、 权 值 的 修改 等 均 没 有 提供 。 


在 这 节 的 程序 设计 中 ,将 对 文件 读 入 功能 做 改进 。 首 先 提供 点 的 个 数 和 边 的 个 数 ,然后 


约定 结 点 名 称 为 26 个 大 写字 母 从 头 开始 自然 读 取 , 边 的 信息 改 为 结 点 名 之 间 直 接 体现 ,请 
看 下 面 带 权 连 通 无 向 图 约定 的 文件 数据 : 
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9 

11 
<AB>= 
<AC>= 
<AD>= 
<CE>= 
<CF>= 
<DG>= 
<DH>= 
<EI>= 
<FI>= 
<GI>= 
<HI>= 


【程序 源码 9-5】 最 小 生成 树 的 部 分 程序 源码 。 
// 功 能 : 最 小 生成 树 的 两 种 算法 


# include < iostream> 
#include < conio.h> 

# include < windows.h> 
# include < cstring> 


wbhouwnbaouD 


# include < fstream > 
# include < iomanip > 
using namespace std; 


enum returninfo{ success, wrong, fail, error}; // 定 义 错误 类 型 
const int Maxsize = 26; // 设 置 邻接 矩阵 的 最 大 限 , 此 处 用 字母 
// 个 数 
float MGraph[ Maxsize][Maxsize] = {0}; // 邻 接 和 矩阵 初始 化 为 0 
int flag[ Maxsize] = {0}; // 初 始 化 标志 位 全 部 为 0 
int delflag[Maxsize] = {0}; // 初 始 化 已 经 删除 结 点 的 标志 位 为 0 
int nodenumber = 10, deletenumber = 0; //nodenumber 结 点 个 数 , deletenumber 被 删除 结 点 的 个 数 
int datamark = 0; // 标 志 目 前 是 否 已 经 有 图 的 数据 ,0 为 
// 没 有 建立 结 点 类 
class node // 创 建 一 个 node 类 来 表示 边 的 信息 
{ 
public: 
node(char initpointstart, char initpointend, float initweight, node * initnext = NULL); 
node(node * initnext = NULL); // 构 造 函 数 重 载 ,为 头 结 点 节省 空间 
~node(); 
void display(void); // 显 示 边 的 结 点 以 及 权 值 信息 
char pointstart; // 边 的 起 点 【约定 ASCII 码 小 】 
char pointend; // 边 的 终点 [约定 ASCII 码 大 】 
float weight; // 边 的 权 值 
node * next; // 后 继 结 点 指针 
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}; 


// 最 小 生成 树 类 

class minispantree 

{ 

public: 
minispantree( ); 
~minispantree(); 


bool readfile(); // 读 文件 操作 
void traveral (void); // 显 示 当 前 邻接 矩阵 
returninfo nodeinsdel (void); // 结 点 的 增删 操作 
returninfo edgeinsdel (void); // 边 的 增删 操作 
returninfo edgemodify(void); // 修 改 边 的 权 值 
void failflag(void); // 显 示 标志 位 信息 
char letterchange(char nodenameofedge); // 小 写字 母 换 成 大 写字 母 
returninfo kruskal(); //Kruskal 算法 
returninfo prim( ); //Prinm 算法 

protected: 


linklist list[4]; 
//0、1 下 标 表示 Prim 算法 初始 和 最 终 数 据 ,2、3 下 标 表示 Kruskal 算法 的 初始 和 最 终 数据 
}; 
void minispantree: :traveral (void) 
{ 
int i,j; 
char inode = 'A'; 
cout <<" | "; 
for(i= 0;i< nodenumber;i++) 
cout << setw(6)<< setiosflags(ios::right)<< inodet++; 
inode= 'A'; // 重 新 赋值 
cout << endl <<" 一 一 十 "; 
for(i=0;i<nodenumber;i++) 
cout <<" 一 
for(i=0;i<nodenumber;i++) 
{ 


cout << end] <<" "<< setw(2)<< inode++<<" | "; 
for(j=0;j<nodenumber;j++) 


{ 
if(delflag[i] ==1 || delflag[j] ==1) // 删 除 点 
cout << setw(6)<< setiosflags(ios: :right)<<"m"; 
else if(i!=j && MGraph[i][j] ==0) // 无 边 
cout << setw(6)<< setiosflags(ios: :right)<<"%"; 
else 
cout << setw(6)<< setiosflags( ios: :right)<< MGraph[ i][j]; 
} 


cout << endl <<" | "; 
} 
cout << endl << endl <<"【 温 声 提 示 ] 数 据 显示 为 嘿 的 表示 该 点 被 删除 ,无 数据 显示 . "<< endl << 
endl; 
} 


图 9-28 为 最 小 生成 树 进 入 界面 和 显示 数据 功能 的 运行 图 。 
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9-28 求 最 小 生成 树 进入 界面 和 显示 数据 功能 运行 图 


9.8.2 构造 最 小 生成 村 的 Prim 算法 


假设 G=(V,E) 为 一 网 图 ,其 中 V 为 网 图 中 所 有 项 点 的 集合 ,E 为 网 图 中 所 有 带 权 边 的 
集合 。 

设置 两 个 新 的 集合 U 和 工 ,其 中 集合 U 用 于 存放 G 的 最 小 生成 树 中 的 顶点 ,集合 工 存 
放 G 的 最 小 生成 树 中 的 边 。 

aii u 出 发 , 则 令 点 集合 U 的 初 值 为 U= {uw}), 边 集合 下 
的 初 值 为 T={ 

Prim mr uEU,vEV 一 U 的 边 中 ,选取 具有 最 小 权 值 的 边 (u,v) ,将 
顶点 v 加 入 集合 U 中 ,将 边 (u,v) 加 入 集合 工 中 ,如 此 不 断 重 复 ,直到 U=V 时 ,最 小 生成 树 
构造 完毕 ,这 时 集合 中 包含 了 最 小 生成 树 的 所 有 边 ,也 就 是 说 在 保证 连通 性 的 同时 不 断 
选取 最 小 的 边 ,直到 构造 完毕 。 

Prim 算法 可 用 下 述 过 程 描述 ,其 中 用 ww 表示 顶点 u 与 顶点 v 边 上 的 权 值 。 这 种 算法 
没有 考虑 回路 问题 ,但 是 在 选 边 的 过 程 中 必须 保持 连通 性 。 

(1) U= {ul1},T={}; 

(2) while( UV)do 

(WV)=min{ww; uEU,vEV 一 U } 
TIT=T 二 ({((uyv)} 
U=U+{v} 

(3) 结束 。 

图 9-29 为 Prim 算法 构造 最 小 生成 树 的 过 程 示意 图 。 按 照 Prim 方法 ,起 点 可 以 为 任意 
一 个 结 点 ,如 从 顶点 a 出 发 ,在 5、6、7 这 3 条 边 中 选择 最 小 的 边 5, 选 择 了 顶点 c 之 后 ,涉及 
的 边 为 2.3、6、7, 青 选择 最 小 的 边 2, 选 择 结 点 e 后 ,涉及 的 边 为 1.2、3、6、7。 此 时 选择 1, 图 
中 的 虚线 涉及 的 边 为 2.3、4、3、6、7, 其 最 小 的 边 为 2, 青 往 后 的 过 程 由 读者 自行 完成 。 最 后 
选 出 的 边 值 集合 为 (5,2,1,2,3,4,5,7) ,其 中 虽然 有 些 边 的 权 值 更 小 ,但 是 因为 会 形成 环 路 ， 
所 以 不 能 选 入 ,最 终 的 最 小 代价 总 权 值 为 29。 

下 面 为 Prim 算法 部 分 源码 ,本 函数 可 以 对 非 连通 图 进行 判断 提示 ,在 不 能 产生 最 小 生 
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9-29 ”Prim 算法 构造 最 小 生成 树 的 过 程 示意 图 


成 树 时 正常 运行 。 


returninfo minispantree: :prim( ) //Prim 算 法 
{ 
//list[4]: 其 中 0、1 坐标 表示 Prim 算 法 的 初始 链表 和 最 终结 果 链 表 


list[0].clearlist(); // 每 次 调用 算法 前 将 初始 和 最 终 数 据 清空 
list[1].clearlist(); 
char beginnode; // 进 入 结 点 名 称 
node * newnode, * searchp, * followp, * listrear; // 新 结 点 ,搜索 指针 、 尾 随 指针 、 尾 部 指针 
int i,j; // 循 环 遍历 
int nodeflag= 0; // 结 点 标志 位 
for(i=0;i<nodenumber;i++) // 标 志 位 归 零 

flag[i] = 0; 


cout <<" 请 在 下 面 范围 中 输入 起 始 结 点 名 称 [KR- "<< char( 'A' + nodenumber -1)<<"】: "; 


cin >> beginnode; 


beginnode = letterchange( beginnode); // 小 写 转换 成 大 写 
if(beginnode == 0) // 输 入 数据 有 误 
return error; 
i= int(beginnode — 'A'); // 计 算出 进入 结 点 的 序号 
flag[i] =1; // 把 该 序号 代表 的 起 始点 的 标志 位 翻转 为 1 


while(list[1].number!= nodenumber — 1 - deletenumber) 
{ 
for(j= 0;j< nodenumber;j++) 
if(MGraph[ i][j]!= 0) //i 固定 不 变 , 把 所 在 行 的 列 全 部 过 一 遍 
// 如 果 邻 接 和 矩阵 中 权 值 不 为 0, 则 把 该 边 加 到 链表 中 
{ 
newnode = new node(i+ 'A',j+ 'A',MGraph[i][j]); 
// 结 点 中 存 人 相应 的 结 点 名 和 权 值 
if(list[0].empty()) // 如 果 此 时 链表 为 空 
{ 
newnode 一 > next = NULL; 
list[0]. headp — > next = newnode; 
list[0].numbert++; 
} 
else 
{ 
// 如 果 这 条 边 已 经 存在 的 话 , 则 无 须 加 入 
searchp = list[0]. headp — > next; // 启 动 搜索 指针 
followp = list[0]. headp; // 启 动 尾随 指针 
whilel( searchp!= NULL && searchp — > weight < MGraph[ i][j]) 
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// 升 序 , 找 正确 位 置 


followp = searchp; 
Searchp = searchp 一 > next; 
} 
whilel( searchp!= NULL && searchp — > weight == MGraph[ i][j]) 


// 当 发 现 权 值 相等 时 
{ 
if(searchp—> pointstart == i+ 'A'&& searchp 一 > pointend == j+ 'A') 
// 起 点 终点 相同 
{ 
nodeflag= 1; 
delete newnode; // 释 放 新 结 点 
break; 
} 
searchp = searchp 一 > next; // 往 后 移动 指针 
} 
if(followp!= NULL && nodeflag == 0) 
{ 
newnode — > next = followp — > next; // 插 入 新 结 点 到 链表 中 
followp - > next = newnode; 
list[0].number++; /1 计数器 加 1 
nodeflag = 0; // 重 新 归 零 


} 
} 
if(list[0].number ==0 ) 
{ if(delflag[i] ==1) 
{ 
cout << endl <<" 你 输入 的 结 点 "<< char(i+ 'A')<<" 已 被 删除 !"<< endl; 
cout << endl << 史 温 声 提示 也 << endl 
<<"1. 标 志 值 为 0 表示 为 暂 未 选 人 的 结 点 群 ; "<< endl 
<<"2. 标 志 值 为 1 表示 已 被 选 人 的 结 点 群 ; "<< endl 
<<"3. 标 志 值 为 田 表示 已 删除 结 点 群 . "<< endl << endl; 
failflag() 7 // 显 示 标 志 位 信息 
return error; 
} 
cout << endl << 史 温馨 提示 也 << endl 
<<"1. 标 志 值 为 0 表示 为 暂 未 选 人 的 结 点 群 ; "<< endl 
<<"2. 标 志 值 为 1 表示 已 被 选 和 人 的 结 点 群 ; "<< endl 
<<"3. 标 志 值 为 轩 表示 已 删除 结 点 群 . "<< endl << endl; 
failflag(); // 显 示 标志 位 信息 
return fail; 
} 
searchp = list[0]. headp — > next; // 取 当前 list[0] 链 表 中 权 
// 值 最 小 的 边 
While( searchp— > next!= NULL && 
flag[ int( searchp -> pointstart — 'A')] + flag[ int(searchp -> pointend— 'A')] == 2) 
// 此 时 searchp 涉及 边 的 起 点 和 终点 均 在 已 选 行列 ,舍弃 ,否则 构成 回路 
{ 
list[0].headp—> next = searchp 一 > next; 
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delete searchp; 


Searchp = 1]ist[0]. headp - > next; 


} 
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// 释 放空 间 
// 重 新 启动 搜索 指针 


// 此 时 searchp 指向 一 个 有 效 边 ,将 其 加 入 到 list[1] 中 ,并 且 将 结 点 加 入 已 选 行列 
i=flag[int(searchp—> pointstart — 'A')]< flag[ int(searchp— > pointend— 'A')]? 
(searchp—> pointstart — 'A'):(searchp—> pointend— 'A'); 


flag[i]=1; 


// 选 取 小 者 标志 位 


newnode = new node( searchp - > pointstart, searchp - > pointend, searchp - > weight); 


// 三 数据 存 人 结 点 
newnode 一 > next = NULL; 
if(list[1].empty()) 


{ 
list[1]. headp -> next = newnode; 
listrear = newnode; 

} 

else 

| 


listrear -> next = newnode; 
listrear = newnode; 
} 
list[1].number++; 
for(i=0;i<nodenumber;i++) 


// 如 果 此 时 为 空 


// 启 用 一 个 链表 的 尾部 指针 用 于 每 次 插 
// 入 在 最 后 的 位 置 上 


// 挂 链 到 最 后 一 个 结 点 
// 移 动 尾部 指针 ,为 下 一 次 挂 链 做 准备 


// 扫 描 判 断 是 否 为 最 小 生成 树 ,全 部 标志 位 为 1 则 可 构成 最 小 生成 树 , 否则 不 连通 


if(flag[i]!= 1 && delflag[i] ==0) 


{ 


cout << endl <<"【 温 馨 提示 】"<< endl 


// 最 终 状态 是 全 部 标志 位 为 1, 否则 不 能 
// 构 成 最 小 生成 树 


<<"1. 标 志 值 为 0 表示 为 暂 未 选 人 的 结 点 群 ; "<< endl 
<<"2. 标 志 值 为 1 表示 已 被 选 人 的 结 点 群 ; "<< endl 
<<"3. 标 志 值 为 嘿 表示 已 删除 结 点 群 . "<< endl << endl; 


failflag(); 
return fail; 
. 
float total = 0; 
searchp = list[1]. headp — > next; 
while( searchp!= NULL) 
{ 
searchp -> display(); 
total += searchp 一 > weight; 
Searchp = Searchp 一 > next; 


} 


cout << endl <<" 最 小 生成 树 的 总 权 值 为 : 


return success; 


// 显 示 标志 位 信息 


// 总 权 值 清 零 
// 对 结果 链表 进行 扫描 
// 显 示 最 小 生成 树 信息 


// 显 示 当 前 边 的 信息 
// 累 加 最 小 生成 树 的 权 值 


"<< total << endl; 


// 显 示 总 权 值 
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Prim 算法 求 最 小 生成 树 过 程 运行 图 如 图 9-30 所 示 。 


i 
下 
Br 


J 


a 外科 法 ，》 


选择 了 Prim 算 法 : 
a [a-1]:n 
《C.E>=2 
《E.I>=1 
《1,.F)=2 
《I.H>=3 
《I.G7=4 
<《G.D)=5 
A.B)=7 


小 生成 树 的 总 权 值 为 ，29 


in 算 法 成 功 ! 请 按 任意 键 继续 .… 


9-30 ”Prim 算法 求 最 小 生成 树 过 程 运 行 图 


在 Prim 算法 中 ,while 循环 中 套 着 一 个 for 循环 ,时 间 复 杂 度 为 O(nodenumber’ ) ,该 循 
环 中 又 包括 了 三 个 while 并 列 循环 分 别处 理 数据 排序 .处 理 权 值 和 行列 值 相等 .排除 构成 回 
路 的 边 ,执行 次 数 都 是 O(edgenumber) ,另外 两 个 循环 判断 是 否 为 最 小 生成 树 和 显示 结果 
链表 均 为 OCOnodenumber) ,忽略 不 计 , 所 以 Prim 算法 的 时 间 复 杂 度 为 O(nodenumber** 


edgenumber) 。 


9.8.3 构造 最 小 生成 树 的 Kruskal 算法 


Kruskal 算法 和 Prim 算法 的 区 别 是 首先 不 考虑 连通 性 ,而 是 按照 网 中 边 的 权 值 递增 的 
顺序 来 构造 最 小 生成 树 的 方法 ,因为 要 想 达 到 生成 树 总 权 值 最 小 :总 体 来 说 必须 在 保证 没有 
环 路 的 情况 下 选择 更 小 权 值 代表 的 边 。 

其 基本 思想 是 : 设 无 向 连通 网 为 G=(V,E) , 令 G 的 最 小 生成 树 为 工 ,其 初 态 为 工 一 

{}), 即 开始 时 ,最 小 生成 树 工 由 图 G 中 的 nm 个 顶点 构成 ,顶点 之 间 没 有 一 条 边 , 这 样 工 
中 各 顶点 各 自 构成 一 个 连通 分 量 ,然后 按照 边 的 权 值 由 小 到 大 排序 ,逐一 考察 G 的 边 集 世 
中 的 各 条 边 。 

若 被 考察 的 边 的 两 个 顶点 属于 工 的 两 个 不 同 的 连通 分 量 , 说 明 没有 构成 环 路 ,将 此 边 
作为 最 小 生成 树 的 边 加 入 到 工 中 ,同时 把 两 个 连通 分 量 连接 为 一 个 连通 分 量 ; 若 被 考察 边 
的 两 个 顶点 属于 同一 个 连通 分 量 ,说 明 这 将 构成 环 路 , 则 舍 去 此 边 ,重复 此 过 程 , 当 最 后 工 
中 的 连通 分 量 个 数 为 1 时 ,此 连通 分 量 便 为 G 的 一 棵 最 小 生成 树 。 

为 了 保存 最 小 生成 树 的 边 ,构造 了 两 条 链表 : 初始 链表 和 结果 链表 。 第 一 条 用 于 存储 
所 有 非 零 权 值 的 边 , 之 后 启用 第 二 条 链表 用 来 存储 能 进入 最 小 生成 树 的 边 。 


& 216 


第 9 章 图 的 构造 与 应 用 


Kruskal 算法 构造 最 小 生成 树 具体 的 过 程 如 下 : 
(1) 把 邻接 矩阵 的 上 三 角 非 零 权 值 按照 行 优先 的 次 序 逐 一 处 理 , 按 照 升序 存储 在 初始 
链表 中 。 

(2) 从 初始 链表 中 逐一 考察 每 一 个 结 点 ,分 为 以 下 几 种 情形 : 

@ 如 果 结 点 中 边 的 两 个 点 的 标志 位 都 为 0, 说 明 是 新 的 边 集 ,都 可 以 进入 最 小 生成 树 。 

@ 如 果 边 涉及 的 两 个 点 的 标志 位 只 有 一 个 为 0. 那么 不 为 0 的 结 点 可 以 进入 最 小 生成 树 。 

@ 如 果 两 个 标志 位 都 不 为 0, 则 又 分 为 几 种 情况 。 如 果 两 者 相等 ,说 明 当 前 处 理 的 边 的 
两 个 结 点 在 同一 个 边 集 中 ,已 经 出 现 了 环 路 , 则 该 边 不 能 进入 到 结果 链表 中 。 如 果 
两 者 不 同 ,说 明 这 条 边 的 两 个 结 点 分 属于 两 个 不 同 的 边 集中 ,此 时 可 以 合并 这 两 个 
边 集 ,需要 注意 的 是 合并 后 标志 位 大 的 结 点 应 该 把 标志 位 全 部 改 为 小 的 。 

@ 如 果 全 部 结 点 的 标志 位 都 为 1, 说 明 所 有 结 点 都 已 经 进入 最 小 生成 树 ,否则 说 明 该 图 
不 连通 ,构建 最 小 生成 树 失败 。 

@ 如 果 可 以 构成 最 小 生成 树 , 则 逐一 输出 结果 链表 中 的 每 一 个 结 点 并 累加 权 值 , 结 点 
中 包含 了 边 涉 及 的 起 始点 、 终 止 点 和 权 值 。 

图 9-31 为 按照 Kruskal 方法 构造 最 小 生成 树 的 过 程 。 


1 2 2 3 3 4 3 5 6. 718 
VVVYxvVvVVVxY 


图 9-31 Kruskal 算法 构造 最 小 生成 树 的 过 程 示意 图 


Kruskal 算法 部 分 源码 如 下 。 

returninfo minispantree: :Kruskal() //Kruskal 算法 

char nodenamestart, nodenameend; // 边 的 开始 结 点 名 ,结束 结 点 名 
node * newnode, * searchp, * followp, x listrear; ”// 新 结 点 ,搜索 指针 、 尾 随 指针 、 链 表 尾 部 
int mark = 0; We 标志 记录 当前 结 点 属于 哪个 边 集 


int noderow, nodecol, tempvalue, tempbigger; // 结 点 对 应 的 行列 ,临时 存储 使 用 的 变量 名 两 个 
int nodeflag; 
// 标 志 链 表 结 点 是 否 可 以 进入 最 小 生成 树 , 为 1 进入 ,为 0 失败 


int i, j,k; // 循 环 变量 名 
for(k= 0;k<nodenumber;k++) // 是 否 已 经 进入 最 小 生成 树 的 标志 位 全 部 
// 清 零 
flag[k] =0; 
list[2].clearlist(); // 每 次 开始 时 将 初始 链表 和 最 终结 果 链 
// 表 清空 


list[3].clearlist(); 
//list[4]: 2、3 坐标 表示 Kruskal 算法 的 初始 链表 和 最 终结 果 链 表 
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for(i=0;i<nodenumber — 1;i++) // 扫 描 邻 接 和 矩阵 中 所 有 结 点 所 在 行 和 列 
for(j=i+1;j<nodenumber;j++) // 用 行 优先 法 处 理 上 三 角 和 矩阵 的 所 有 非 0 
// 的 权 值 


{ 


} 


if(MGraph[ i][j]!= 0) 
// 将 非 零 的 权 值 涉 及 的 行列 坐标 和 权 值 数据 加 入 到 链表 中 [ 按 权 值 升序 排列 】 


{ 


} 


nodenamestart =i+'A'; // 利 用 ASCII 码 把 行 坐标 转换 成 结 点 名 
nodenameend = j+ 'A'; // 利 用 ASCII 码 把 列 坐标 转换 成 结 点 名 
newnode = new node( nodenamestart, nodenameend, MGraph[ i][j]); 
// 申 请 新 结 点 ,把 边 涉及 的 两 个 结 点 和 权 值 存 人 
证 (list[2].empty()) ”// 如 果 此 时 链表 为 空 , 则 作为 第 一 个 结 点 挂 入 
, 
newnode 一 > next = NULL; 
list[2]. headp - > next = newnode; 
} 
else 
{ 
followp = list[2]. headp; 
searchp = list[2]. headp — > next; 
whilel( searchp!= NULL && searchp - > weight < MGraph[ i][j]) 
// 为 了 保证 有 序 , 找 正确 位 置 
{ 
followp = searchp; 
searchp = searchp— > next; 
} 
newnode — > next = searchp; // 找 到 后 挂 链 , 保 持 权 值 从 小 到 大 排列 
followp — > next = newnode; 
} 


list[2].numbert+; // 结 果 链 表 个 数 计数 器 加 1 


// 下 面 将 从 有 序 链表 结 点 中 按照 从 小 到 大 的 次 序 选 出 最 小 生成 树 合法 的 边 
searchp = list[2]. headp - > next; // 启 动 搜索 指针 
while(searchp!= NULL && list[3]. number!= nodenumber — 1) 

// 当 链表 没有 完 而 且 产生 的 边 数 不 够 时 继续 产生 


{ 


nodeflag = 1; // 每 次 开始 重新 设置 为 1, 假设 当前 结 点 
// 是 可 以 加 入 最 小 生成 树 的 

noderow = Searchp 一 > pointstart — 'A'; // 把 当前 起 点 的 结 点 名 换 为 原 邻 接 矩 阵 中 
// 的 行 坐标 

nodecol = searchp -> pointend— 'A'; // 把 当前 终点 的 结 点 名 换 为 原 邻 接 和 矩阵 中 
// 的 列 坐 标 

if(flag[ noderow] + flag[nodecol] == 0) // 如 果 都 是 为 0, 说 明 这 两 个 结 点 都 可 以 
// 进 入 最 小 生成 树 


} 


flag[noderow] = ++mark; 
// 每 当 新 的 边 集合 开始 时 标志 位 不 断 增加 1, 用 来 判断 该 图 是 否 是 联通 图 
flag[nodecol] = mark; 


else if(flag[noderow] * flag[nodecol] == 0) // 只 有 一 个 为 0 


{ 


tempvalue = (flag[ noderow]> flag[nodecol])?flag[noderow] :flag[ nodecol]; 


// 选 择 非 零 的 值 
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flag[noderow] = tempvalue; // 目 的 是 保持 进入 当前 的 边 集中 
flag[nodecol] = tempvalue; 
} 
else if(flag[noderow] * flag[nodecol]!= 0) // 如 果 都 不 为 0 的 情况 ,分 情况 讨论 
{ 
if(flag[noderow] == flag[nodecol]) 
// 标 志 位 两 者 相等 ,说 明 在 一 个 边 集中 ,也 就 是 环 , 必须 舍弃 
nodeflag = 0; // 结 点 舍弃 通过 标志 位 翻转 为 0 达成 ,此 
// 中 只 有 这 一 种 情况 
else 
// 两 者 都 不 为 0 且 不 相等 ,说 明 开 始 时 不 在 一 个 边 集 中 , 现在 联通 了 ,需要 合并 边 集 , 故 取 小 值 
{ 
tempvalue = (flag[ noderow]< flag[ nodecol])?flag[ noderow] :flag[ nodecol]; 
// 准 备 小 的 标志 位 
tempbigger = (flag[ noderow]> flag[ nodecol])?flag[ noderow] :flag[nodecol]; 
// 记 录 大 的 标志 位 
for(k= 0;k<nodenumber;k++) 
// 所 有 标志 位 扫描 ,等 于 大 标志 位 的 全 部 刷新 为 小 的 标志 位 
if(flag[k] == tempbigger) 
flag[k] = tempvalue; 


else // 如 果 有 其 他 现象 则 表明 有 错 并 且 显 示 
// 所 有 结 点 的 标志 


return error; 
} 
if(nodeflag==1) // 表 示 这 个 结 点 符合 最 小 生成 树 的 条 件 
{ 

// 将 此 结 点 添加 到 最 终 状态 链表 中 [ 尾 插 法 】 

newnode = new node( searchp — > pointstart, searchp - > pointend, searchp — > weight); 

newnode 一 > next = NULL; 

if(list[3].empty()) 

// 如 果 此 时 链表 为 空 , 则 作为 第 一 个 结 点 挂 人 
{ 
list[3].headp— > next = newnode; 


listrear = newnode; // 启 用 一 个 链表 的 尾部 指针 用 于 每 次 插 
// 入 在 最 后 的 位 置 上 
} 
else 
{ 
listrear -> next = newnode; // 挂 链 到 最 后 一 个 结 点 
listrear = newnode; // 移 动 尾部 指针 ,为 下 一 次 挂 链 做 准备 
list[3]. number++; 1/ 计数器 加 1 


} 
Searchp = Searchp 一 > next; 


// 继 续 处 理 下 一 个 结 点 , 边 数 足够 时 马上 停止 
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} 
for(k= 0;k< nodenumber;k++) 
// 扫 措 判 断 是 否 为 最 小 生成 树 ,全 部 标志 位 为 1 则 可 构成 最 小 生成 树 , 否则 不 连通 
if(flag[k]!=1 g& delflag[k] == 0) 
// 只 要 遇 到 一 个 结 点 标志 位 不 为 1 而 且 不 是 被 删除 的 结 点 , 则 失败 
{ 
cout << endl <<"【 温 声 提 示 】"<< endl <<"1. 标 志 值 为 0 表示 为 孤立 结 点 ; " 
<< endl <<"2. 标 志 值 为 非 0 且 相 等 的 表示 互联 的 结 点 集合 ; " 
<< endl <<"3. 标 志 值 为 图 表示 已 删除 结 点 集合 . "<< endl << endl; 


failflag(); // 显 示 标志 位 信息 
return fail; // 直 接 退 出 
} 
float total = 0; // 总 权 值 累 加 器 清 零 
searchp = list[3]. headp - > next; // 启 动 搜索 指针 
while( searchp!= NULL) // 显 示 最 后 最 小 生成 树 的 边 
{ 
searchp -> display(); // 每 一 个 结 点 的 三 个 值 被 依次 输出 
total += searchp -> weight; // 总 权 值 累加 
Searchp = Searchp -> next; // 移 动 链表 搜索 指针 


} 
cout << endl <<" 最 小 生成 树 的 总 权 值 为 : "<< total << endl; 

// 显 示 总 权 值 
return success; 


} 
Kruskal 算法 求 最 小 生成 树 过 程 运 行 图 如 图 9-32 所 示 。 


图 9-32 ” Kruskal 算法 求 最 小 生成 树 过 程 运 行 图 
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这 次 选择 的 边 显然 是 按照 权 值 从 小 到 大 排列 的 。 

在 Kruskal 算法 中 , 结 点 个 数 为 nodenumber, 边 个 数 为 edgenumber, 时 间 效 率 分 析 如 
下 : 把 稀 玻 矩阵 的 所 有 数据 扫描 完毕 为 O(nodenumber*) ,其 中 还 有 一 个 循环 结构 用 于 数据 
的 排序 ,长 度 为 边 的 个 数 edgenumber, 另 外 3 个 循环 选择 合法 边 .判断 是 否 为 最 小 生成 树 和 
显示 结果 链表 均 为 O(nodenumber), 忽 略 不 计 , 故 最 终 时间 复 杂 度 为 O(nodenumber“ 


edgenumber) 。 


9.9 本 章 总 结 


本 章 介绍 了 图 结构 , 它 是 现实 生活 中 复杂 模型 的 抽象 。 仅 利用 某 种 独立 的 存储 结构 很 
难 完成 图 的 存储 ,只 有 综合 利用 数组 和 链表 等 基础 数据 结构 才 可 以 解决 存储 结构 的 困难 , 特 
别 是 利用 数学 中 的 矩阵 可 以 巧妙 地 化 解 图 的 复杂 性 ,前面 讨论 过 的 三 元 组 等 存储 结构 也 作 
为 基础 对 图 的 应 用 产生 影响 。 遍 历 是 图 结构 中 最 基本 和 最 重要 的 操作 ,本 章 讨论 了 两 种 : 
深度 优先 遍历 和 广度 优先 遍历 ,它们 又 分 别 使 用 了 前 期 讨论 过 的 基础 数据 结构 一 一 栈 和 队 
列 。 这 两 种 遍历 可 以 演变 成 很 多 实际 课题 的 算法 。 本 章 最 后 对 图 结构 在 应 用 中 的 程序 设计 
进行 了 讨论 ,如 最 短路 径 .拓扑 排序 ,还 介绍 了 最 小 代价 生成 树 的 两 种 算法 。 


习 题 


一 、 原 理 讨论 题 

1. 图 的 结构 中 ,有 没有 类 似 树 结构 的 根 结 点 那样 的 进入 结 点 ? 为 什么 ? 

2. 图 的 邻接 表 中 , 挂 链 的 结 点 中 为 什么 不 能 存放 实际 要 处 理 的 数据 ? 

二 、 理论 基本 题 

1. 写 出 以 下 概念 的 定义 : 图 、 有 向 图 、 无 向 图 、 结 点 的 度 、 顶 点 、 边 、 弧 、 弧 头 、 弧 尾 、 完 全 
图 .稠密 图 、 稀 琉 图 . 边 的 权 、 网 图 。 

2. 分 别 画 出 2、3、4、5 的 结 点 的 无 向 完全 图 。 

3. 画 出 有 向 图 、 无 向 图 、 网 图 、 子 图 、 生 成 树 等 的 示意 图 。 

4. 写 出 主要 的 关于 图 的 操作 清单 。 

5. 画 出 图 的 邻接 矩阵 存储 结构 的 示意 图 。 

6. 画 出 图 的 邻接 表 的 存储 结构 的 示意 图 。 

7. 自己 画 出 一 个 图 ,给 出 深度 优先 和 广度 优先 遍历 的 结果 。 

8. 自己 画 出 一 个 图 , 画 出 求 其 最 小 代价 生成 树 的 结果 。 

9. 自己 画 出 一 个 图 , 画 出 求 其 最 短路 径 的 结果 。 

10. 自己 画 出 一 个 有 向 图 , 求 其 拓扑 排序 的 结果 。 

三 、 编 程 基本 题 
. 编程 将 无 向 图 的 邻接 矩阵 存储 结构 转换 成 邻接 表 存 储 结构 。 
. 存储 结构 采用 邻接 表 , 实 现 有 向 图 的 基本 运算 ,包括 深度 优先 和 广度 优先 遍历 。 
. 存储 结构 采用 邻接 矩阵 ,实现 无 向 图 的 基本 运算 ,包括 深度 优先 和 广度 优先 遍历 。 
. 用 非 递 归 算 法 实现 深度 优先 的 程序 。 


上 oo 性 
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5. 编程 实现 求 某 个 结 点 的 出 度 或 人 度 。 

6. 编程 实现 查询 某 两 个 结 点 之 间 是 否 有 边 。 

7. 编程 实现 求 图 中 最 小 代价 生成 树 。 

8. 编程 实现 求 图 中 其 中 任何 两 个 结 点 之 间 的 最 短路 径 。 

9. 编程 实现 求 图 中 拓扑 排序 。 

10. 编程 判断 某 个 图 是 否 连通 图 ,如 从 某 一 个 结 点 出 发 进行 遍历 , 若 个 数 结果 和 已 知 的 
总 结 点 数 不 符 , 则 代表 该 图 是 不 连通 的 。 

11. 编程 求 图 的 联通 分 量 。 

12. 编程 解决 经 典 的 欧 拉 七 桥 问题 ,其 实质 是 检测 所 有 顶点 的 度 都 是 偶数 ,否则 便 是 
无 解 。 

四 、 编程 提高 题 

1. 编程 实现 判断 某 个 无 向 图 是 否 是 一 棵 树 。 

2. 编程 实现 判断 某 个 有 向 图 是 否 是 一 棵 以 Vo 为 根 的 有 向 树 。 

3. 编程 实现 求 出 无 向 图 的 连通 分 量 个 数 。 

4. 编程 实现 求 长 度 为 n 的 环 。 

五 、 思 考题 

1. 按照 马 走 ”日 ?字形 的 走 法 ,把 1.2.3、4、…\、64 分 别 填 人 一 个 8X8 的 棋盘 中 。 初 始 
位 置 由 键盘 输入 。 

2. 铁路 调度 系统 模拟 显示 程序 。 在 调度 员 面前 有 很 多 条 铁路 ,不 断 有 火车 申请 线路 ， 
根据 情况 决定 停靠 在 某 个 车 道上 ,或 从 某 个 车 道 通过 。 

3. AOE 网 和 关键 路 径 的 研究 。 若 在 带 权 的 有 向 图 中 ,以 顶点 表示 事件 ,以 有 向 边 表示 
活动 , 边 上 的 权 值 表 示 活 动 的 某 种 代价 (如 该 活动 持续 的 时 间或 需要 的 人 数 ) , 则 此 带 权 的 有 
向 图 称 为 AOE 网 。AOE 网 具有 以 下 两 个 性 质 : 四 只 有 在 某 顶 点 所 代表 的 事件 发 生 后 ,从 
该 项 点 出 发 的 各 有 向 边 所 代表 的 活动 才能 开始 。@@ 只 有 在 进入 某 一 顶点 的 各 有 向 边 所 代表 
的 活动 都 已 经 结束 ,该 顶点 所 代表 的 事件 才能 发 生 。 对 于 AOE 网 ,可 采用 与 AOV 网 一 样 
的 邻接 表 存 储 方式 。 其 中 ,邻接 表 中 边 结 点 的 域 为 该 边 的 权 值 , 即 该 有 向 边 代表 的 活动 所 持 
续 的 时 间 。 

由 于 AOE 网 中 的 某 些 活 动能 够 同时 进行 , 故 完成 整个 工程 所 必须 花费 的 时 间 应 该 为 


有 最 大 路 径 长 度 的 路 径 称 为 关键 路 径 。 关 键 路 径 上 的 活动 称 为 关键 活动 。 关 键 路 径 长 度 是 
整个 工程 所 需 的 最 短工 期 。 这 就 是 说 ,要 缩短 整个 工期 ,必须 加 快 关 键 活 动 的 进度 ,如 把 非 
关键 路 径 上 的 多 余人 员 调 往 关键 路 径 上 ,或 者 另外 新 增 其 他 人 员 。 如 果 把 某 一 个 路 径 上 的 
权 值 进行 了 修改 ,那么 关键 路 径 就 可 能 发 生 改变 。 还 要 考虑 到 有 的 时 候 关 键 路 径 不 止 一 条 ， 
其 代价 都 是 一 样 的 ,那么 就 必须 同时 减少 。 编 程 求 图 的 关键 路 径 。 带 权 有 向 图 如 图 9-33 
所 示 。 

4. 关 结 点 和 重 连通 分 量 的 研究 。 假 若 在 删 去 项 点 v 以 及 和 v 相关 联 的 各 边 之 后 ,将 图 
的 一 个 连通 分 量 分 割 成 两 个 或 两 个 以 上 的 连通 分 量 , 则 称 顶 点 v 为 该 图 的 一 个 关 结 点 
(articulation point) 。 一 个 没有 关 结 点 的 连通 图 称 为 重 连通 图 (biconnected graph)。 在 重 
连通 图 上 ,任意 一 对 顶点 之 间 至 少 存在 两 条 路 径 , 则 在 删 去 某 个 顶点 以 及 依附 于 该 顶点 的 各 
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边 时 不 会 破坏 图 的 连通 性 。 若 在 连通 图 上 至 少 删 去 k 个 顶点 才能 破坏 图 的 连通 性 , 则 称 此 


图 的 连通 度 为 k。 编 程 求 图 的 关 结 点 。 


本 02 2 

03 3 
13 2 
这 14 3 
3 d 
Ca 3 
5 工 46 5 
6 g 57 4 
7 h 68 3 
gi 69 5 
9 j 7103 

8102 
0 9102 


9-33 ”AOE 网 示意 图 


5. 有 向 无 环 图 (directed acycline graph) 的 研究 。 一 个 无 环 的 有 向 图 称 作 有 向 无 环 图 ， 
简称 DAG 图 。 有 向 无 环 图 是 描述 含有 公共 子 表达 式 的 表达 式 的 有 效 工 具 。 如 下 述 表 达 
式 : ((a 十 bl)x* (bx (c 十 d) 十 (c 十 d) *e) *((c 十 d) * e)， ((a+b)s(bs(cHd)H(cHd)wejs((cHd)we)) 


除了 使 用 前 面 讨论 的 二 又 树 来 表示 外 ,仔细 观察 该 表达 
式 , 可 发 现 有 一 些 相同 的 子 表达 式 , 如 (c 十 d) 和 (c 十 d) *e 
等 。 在 二 又 树 中 它们 也 重复 出 现 , 若 利用 有 向 无 环 图 , 则 
可 实现 对 相同 子 式 的 共享 ,从 而 节省 存储 空间 ,所 以 DAG 
图 是 一 类 较 有 向 树 更 一 般 的 特殊 有 向 图 。 图 9-34 所 示 为 


该 表达 式 DAG 图 的 示意 图 。 编 程 实现 其 思想 。 图 9-34 有 向 无 环 图 范例 示意 图 
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本 章 介绍 多 种 查找 技术 ,包括 折 半 查找 、 插 值 查找 、 斐 波 那 契 查 找 、 分 块 查找 ,二 又 排序 
树 .平衡 二 又 树 的 结构 , 哈 希 表 结 构 和 相应 的 查找 技术 ,字符 串 的 改进 查找 算法 。 查 找 技术 
在 编程 中 作用 很 大 ,是 重要 的 基础 操作 之 一 ,如 何 提高 查找 速度 将 是 重点 讨论 的 内 容 。 


10.1 引 


了 咱 


顺序 查找 中 ,如 果 只 要 查找 “第 一 个 "符合 条 件 的 数据 ,成 功 则 无 须 把 全 部 数据 都 遍历 一 
次 ; 失败 , 则 肯定 是 把 全 部 数据 已 经 遍历 。 这 个 结论 可 和 否 推广 到 任何 情况 呢 ? 其 算法 时 间 
复杂 度 为 OCn) ,从 一 般 的 评价 标准 看 ,这 个 时 间 复 杂 度 是 不 理想 的 ,那么 如 何 才能 提高 时 间 
效率 呢 ? 本 章 给 出 一 些 新 的 查找 算法 ,时 间 效率 也 有 一 定 提高 ,拓展 了 编程 思想 。 


10.2 有 序 表 的 折 半 查找 和 其 他 变形 


10.2.1 有 了 序 表 的 折 半 查找 


假设 需要 查找 的 静态 表 是 一 个 有 序 表 ( 例 如 表 中 数据 元 素 按 关键 码 升序 排列 ) ,就 可 以 
通过 折 半 查找 提高 查找 效率 ,该 方法 也 被 称 为 二 分 查找 法 。 其 思想 为 : 在 有 序 表 中 , 取 中 间 
元 素 作为 比较 对 象 , 若 给 定 值 与 中 间 元 素 的 关键 码 相等 , 则 查找 成 功 ; 若 给 定 值 小 于 中 间 元 
素 的 关键 码 , 则 在 中 间 元 素 的 左 半 区 继续 查找 ; 若 给 定 值 大 于 中 间 元 素 的 关键 码 , 则 在 中 间 
元 素 的 右 半 区 继续 查找 。 一 直 重 复 上 述 过 程 , 直 到 查找 成 功 , 或 所 查找 的 空间 已 经 不 存在 数 
据 元 素 , 则 查找 失败 。 

图 10-1 是 折 半 查找 的 示意 图 。 要 从 这 批 数 据 中 查找 48, 从 (1 十 9)/2=5 处 开始 比较 ， 
48 二 52 ,如 果 存 在 48 ,必然 在 左 半边 ; 从 (1 十 5)/2==6/2 二 3 处 开始 比较 ,48 之 36 ,再 在 右边 
查找 ,(3 十 5)/2 一 8/2 一 4, 在 位 置 4 找到 ,查找 成 功 。 

既然 中 点 不 是 需要 查找 的 数据 , 那 就 可 以 排除 在 外 ,另外 在 程序 设计 中 还 要 考虑 中 点 不 
是 整数 的 取 整 问题 。 在 C 语言 中 ,整数 除法 会 自动 取 整 ,就 可 以 不 考虑 这 个 问题 了 。 

下 面 进行 效率 分 析 。 以 10 000 个 数据 为 例 ,如 果 使 用 顺序 查找 ,失败 时 要 比较 10 000 
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10-1 折 半 查找 的 示意 图 


次 。 采 用 折 半 查找 ,经 过 5000、2500、1250、625、312、156、78、39、19、9、4、2、1 这 13 次 查找 必 
然 查找 成 功 或 查找 失败 。 以 表 的 中 点 为 比较 对 象 ,并 以 中 点 将 表 分 割 为 两 个 子 表 , 对 定位 到 
的 子 表 继 续 这 种 操作 ,用 一 个 二 叉 树 可 以 描述 这 个 查找 过 程 ,这 种 描述 查找 过 程 的 二 叉 树 称 
为 判定 树 。 

图 10-2 为 折 半 查找 过 程 中 的 判定 树 示 意图 。 在 叶 
子 结 点 处 或 者 查找 成 功 或 者 查找 失败 , 必 为 二 者 之 一 。 
由 于 它 是 按照 二 叉 树 的 结构 从 上 往 下 查找 ,层次 就 是 它 
的 时 间 复 杂 度 , 即 O(logsn)。 

折 半 查找 可 以 大 大 提高 查找 效率 ,但 它 仅 适用 于 有 
序 表 , 并 且 存 储 结构 必须 是 顺序 存储 。 这 表明 一 方面 为 图 10.2 折 半 查找 过 程 的 判定 
了 提高 查找 效率 ,需要 付出 额外 的 代价 ; 另 一 方面 ,存储 树 示意 图 
结构 也 局 限 了 该 算法 的 应 用 。 在 实际 程序 设计 中 ,如 果 
数据 在 线性 链表 中 存储 且 没 有 排序 .但 是 查找 功能 又 是 比较 频繁 的 操作 ,那么 就 可 以 临时 复 
制 一 份 数组 ,排序 后 进行 查找 ,这 样 就 大 大 提高 了 查找 的 速度 。 其 代价 是 付出 了 大 量 的 空间 
代价 ,数据 如 果 有 修改 、 插 入 和 删除 等 操作 时 ,必须 重新 复制 数组 和 排序 ,需要 付出 管理 数据 
的 时 间 成 本 。 

由 于 该 算法 是 多 次 在 更 小 的 空间 中 执行 相同 思路 , 故 可 以 写 出 其 递归 形式 的 程序 。 


10.2.2 有 序 表 的 裴 波 那 奥 查找 和 插值 查找 


折 半 查找 的 思路 是 从 中 间 分 开 , 那 么 这 是 不 是 唯一 的 选择 呢 ? 结论 是 否定 的 。 如 可 以 
使 用 黄金 分 割 点 的 0. 618 作为 一 个 切 分 点 来 设计 。 

计算 机 程序 设计 中 的 计算 在 硬件 最 底层 仅 为 加 法 器 ,之 后 演变 出 减法 ,进一步 演变 成 乘 
法 和 除法 。 为 了 提高 程序 的 运行 速度 ,也 可 以 从 这 方面 着 手 。 上 面 的 折 半 查找 中 有 除法 运 
算 ,而 通过 著名 的 斐 波 那 契 数列 可 以 达成 到 消除 除法 的 目标 。 

斐 波 那 契 查 找 主要 是 通过 斐 波 那 契 数 列 对 有 序 表 进 行 分 割 ,查找 区 间 的 两 个 端点 和 中 
点 都 与 斐 波 那 契 数 有 关 。 斐 波 那 契 数列 的 递归 定义 如 下 : 


n n 二 0 或 n=1 
FBNQ(n) = 
FBNQCn 一 1) 十 FBNQCn 一 2) n 二 2 


对 于 有 nm 个 数据 元 素 的 有 序 表 , 且 正好 是 某 个 斐 波 那 契 数 一 1, 即 n 一 FBNQ(k) 一 1 时， 
则 可 用 斐 波 那 契 查找 法 。 斐 波 那 契 查找 法 切 分 点 的 构造 思想 为 : 对 于 表 长 为 FBNQ(iD 一 1 
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的 有 序 表 ,以 相对 low 偏 移 量 FBNQ(i 一 1) 一 1 取 中 点 , 即 mid==low 十 FBNQ(i 一 1) 一 1, 对 
表 进行 分 割 , 则 左 子 表 表 长 为 FBNQ (i 一 1) 一 1, 右 子 表 表 长 为 FBNQ(i) 一 1 一 
[FBNQ(i 一 1) 一 吉 一 1 王 FBNQ(i 一 2) 一 1。 可 见 , 两 个 子 表 表 长 也 都 是 某 个 斐 波 那 契 数 
一 1, 因 而 ,可 以 对 子 表 继续 分 割 。 

当 n 很 大 时 ,该 查找 方法 吻合 黄金 分 割 法 ,其 平均 性 能 比 折 半 查 找 好 ,但 其 时 间 效 率 仍 
为 O(log:n) ,当然 在 最 坏 情况 下 比 折 半 查找 差 , 其 优点 是 计算 中 点 仅 作 加 、 减 运算 。 

除了 上 面 提 到 了 两 种 改进 方法 外 ,也 可 以 用 插值 查找 ,如 通过 下 列 公式 来 求 取 中 点 。 


mid= low + (seek — data[low])/(data[high] - data[low]) * (high— low) 


其 中 low 和 high 分 别 为 表 的 两 个 端点 下 标 ,seekdata 为 需要 查找 的 值 。 插 值 查找 是 平 
均 性 能 最 好 的 查找 方法 ,但 只 适 于 关键 码 均 匀 分 布 的 表 , 其 时 间 效 率 依然 是 O(logsn)。 
【程序 源码 10-1〗 有 序 表 的 3 种 查找 方式 的 比较 程序 的 部 分 源码 。 


// 有 序 查找 的 3 种 方法 

// 非 递归 折 半 查找 、 递 归 折 半 查 找 , 斐 波 那 契 查 找 
# include < iostream > 

# include < windows.h> 

# include < iomanip > 

using std: :cout; 

using std: :cin; 

using std: :endl; 

using std: :setw; 


#define datawidth 5 // 设 置 数 据 显示 宽度 
# define arraymaxnum 21 // 约 定数 组 大 小 ,0 号 单元 默认 不 用 , 故 用 户 数据 可 以 接受 20 个 
# define defaultnum 10 // 约 定 默认 数据 数组 大 小 ,数据 使 用 教材 实际 范例 
int defaultdata[ defaultnum] = { 0,12,22,36,48,52,56,64,76,83 }; 
//0 号 下 标 默认 不 用 , 故 存 0 
int flag = 0; // 表 示 用 户 没 有 输入 数据 ,使 用 默认 数据 
int count[3] = {0,0,0}; // 存 查找 的 次 数 ,初始 值 为 0 
// 有 序 表 对 象 设计 
class inordersearch 
{ 
public: 
int halfsearching(int * data, int length, int seekdata); 
// 非 递归 折 半 查找 
int halfrsearching( int * data, int head, int tail, int seekdata); 
// 递 归 折 半 查找 
int fib(int length); // 检 测 length 是 否 为 斐 波 那 契 数 


int fbnq( int position); // 计 算 斐 波 那 契 的 第 position 个 值 
int fibonaccisearching(int * data, int length, int seekdata); 
// 斐 波 那 契 查找 
}; 
int inordersearch: :halfsearching(int * data, int length, int seekdata) 
{ 
int low = 1, high = length, flag = 0, nmid; 
while (low <= high) 
由 
mid = (low + high) / 2; 
count[0]++; 
if (data[mid] == seekdata) 
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flag = 1; 
break; 
PF 
else if (data[mid]> seekdata) 
high = mid 一 1; 
else 
low = mid + 1; 
} 
if (flag == 1) 
return mid; 
else 
return 0; 
J 
int inordersearch: :halfrsearching( int * data, int head, int tail, int seekdata) 
{ 
int mid = (tail + head) / 2; 
count[1]++; 
if (tail < head) 
return 0; 
if (x* (data + mid) == seekdata) // 此 处 采用 了 数组 名 起 始 地 址 加 上 偏 移 量 的 方法 
// 读 取 数 据 
return mid; 
else if (* (data + mid)< seekdata) 
return halfrsearching(data, mid + 1, tail, seekdata); 
else 
return halfrsearching(data, head, mid - 1, seekdata); 
} 
int inordersearch: :fbnq( int position) 
{ 
int fbl = 1, fb2 = 1, i, currentdata = 1, flag = 0; 
if (position == 1) return position; 
for (i = 2; i<= position; i++) 


{ 
currentdata = fbl + fb2; 
fb2 = fbl; 
fbl = currentdata; 

} 


return currentdata; 
} 
int inordersearch: :fib(int length) 
{ 
int fbl = 1, fb2 = 1, i, currentdata = 2, flag = 0; 
if (length<= 1) return length; 
for (i = 2; i<= length; i++) 
{ 
currentdata = fbl + fb2; 
if (length < currentdata) 
return fb2; 
fh2 = fbl; 
fbl = currentdata; 
} 


return flag; 
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int inordersearch: :fibonaccisearching(int * data, int length，int seekdata) 


{ 
int high = length, low = 1, flag = 0, mid, fmid, fbnqnum, temp, position = fib(length); 
fbnqnum = fbnq(position) — 1; 
fmid = fbnq(position - 1) - 1; 
while (low <= high) // 这 个 函数 中 没有 出 现 乘除 法 ,只 有 加 减法 
{ 
mid = low + fmid; 
count[2]++; 
if (data[mid] == seekdata) 
f 
flag = 1; 
break; 
} 
else if (seekdata< data[mid]) 
{ 
temp = fmid; 
fmid = fbnqnum - fmid — 1; 
fbnqnum = temp; 
high = mid - 1; 
} 
else 
{ 
fbnqnum = fbnqnum - fmid — 1; 
fmid = fmid - fbnqnum 一 1; 
low = mid + 1; 
} 
小 
if (flag == 1) 
return mid; 
else 
return 0; 


图 10-3 为 有 序 表 3 种 查找 过 程 程序 运行 图 。 


水 
薄 


EE 


图 10-3 有 序 表 3 种 查找 过 程 程序 运行 图 


Ee 


< 228 


第 10 章 “查找 程序 设计 进 阶 


10.2.3 分 块 查找 


分 块 查找 比较 容易 理解 。 例 如 ,要 在 英文 字典 中 查找 structure, 既 然 它 以 s 为 第 一 个 字 
母 ,显然 就 没有 必要 再 去 查 其 他 字母 开头 的 单词 。 分 块 查找 又 称 为 索引 顺序 查找 , 它 是 对 顺 
序 查找 的 一 种 改进 。 分 块 查找 要 求 将 查找 表 分 成 若干 个 子 表 , 并 对 子 表 建 立 索 引 表 ,查找 表 
的 每 一 个 子 表 由 索引 表 中 的 索引 项 确定 。 索 引 项 包括 两 个 字段 : 关键 码 字段 (存放 对 应 子 
表 中 的 最 大 关键 码 值 ) ,指针 字段 (存放 指向 对 应 子 表 的 指针 ) ,并 且 要 求索 引 项 按 关键 码 字 
段 有 序 存放 。 

查找 时 , 先 用 给 定 值 seekdata 在 索引 表 中 检测 索引 项 ,以 确定 所 要 进行 的 查找 在 查找 
表 中 的 哪个 块 中 (由 于 索引 项 按 关键 码 字 段 有 序 , 可 以 使 用 折 半 查找 以 提高 时 间 效率 ), 然 
后 ,再 对 该 块 进行 顺序 查找 。 如 果 块 内 也 是 有 序 的 ,也 可 以 采用 折 半 查找 法 继续 查找 。 

图 10-4 为 分 块 查找 过 程 的 示意 图 。4 个 数据 为 一 组 ,把 该 组 的 最 大 值 作为 索引 字 进 行 
存储 。 


Searcharray 
0123456789101112 
12|06|18[15[21[28|25|29|36|31|39|30 
加 型 | 


indexarray 


-oe 


(a) 组 间 有 序 的 原理 图 (b) 组 间 有 序 的 范例 
图 10-4 ”分 块 查 找 过 程 的 示意 图 


分 块 查找 由 索引 表 查 找 和 子 表 查 找 两 步 完 成 。 设 n 个 数据 元 素 的 查找 表 分 为 m 个 子 
表 , 且 每 个 子 表 均 为 k 个 元 素 , 则 k= n/m。 这 样 ,分 块 查找 的 平均 查找 长 度 (ASL) 为 : 
ASL 二 ASLga 表 十 ASLFz 表 三 (m 十 1)/2 十 (n/m 十 1)/2= 二 (m 十 n/m)/2 十 1 
因此 平均 查找 长 度 不 仅 和 表 的 总 长 度 n 有 关 , 而 且 与 所 分 的 子 表 个 数 m 有 关 。 在 表 长 


n 确定 的 情况 下 ,m 取 Vn 时 ,ASL=Vn 十 1 达到 最 小 值 。 


10.3 二 叉 排序 树 与 相应 的 查找 技术 


静态 查找 技术 的 特点 是 查找 功能 和 其 他 功能 无 关 , 相 对 来 说 查找 也 是 一 种 安全 操作 ,不 
论 执 行 多 少 次 也 不 会 破坏 数据 的 信息 量 。 但 是 有 时 需要 把 查找 和 插入 或 删除 联系 在 一 起 
时 ,情况 就 有 所 不 同 。 本 节 讨 论 如 何 保证 安全 地 查找 目标 ,而 且 不 出 现 数据 的 移动 。 

为 了 能 高 速 查找 同时 不 移动 数据 而 插入 或 删除 数据 ,下 面 的 查找 技术 把 数据 的 构造 和 
查找 过 程 同一 化 , 即 在 查找 成 功 时 返回 相关 信息 ,查找 失败 时 把 该 数据 插入 到 该 数据 结构 
中 ,以 保证 下 一 次 能 查找 成 功 ,这 就 是 “动态 查找 ”, 其 中 每 一 次 插入 数据 的 过 程 都 是 完全 相 
同 的 。 删 除数 据 通 常 只 在 二 叉 树 的 叶子 结 点 上 出 现 。 

二 叉 排 序 树 (Binary Sort Tree) 或 者 是 一 棵 空 树 ,或 者 是 具有 下 列 性 质 的 二 叉 树 : @ 若 
左 子 树 不 为 空 , 则 左 子 树 上 所 有 结 点 的 值 均 小 于 根 结 点 的 值 ; 车 右 子 树 不 为 空 , 则 右 子 树 上 
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所 有 结 点 的 值 均 大 于 根 结 点 的 值 。@ 左 、 右 子 树 也 都 是 二 又 排序 树 。 

二 叉 排序 树 的 查找 过 程 如 下 : 

(1) 若 查找 树 为 空 ,查找 失败 。 

(2) 查找 树 非 空 ,将 给 定 值 finddata 与 查找 树 的 根 结 点 关键 码 比 较 。 

(3) 车 相等 ,查找 成 功 ,结束 查找 过 程 ,否则 : 

@ 若 finddata 小 于 根 结 点 关键 码 , 查 找 将 在 以 左 儿 子 为 根 的 子 树 上 继续 进行 , 转 (1); 

@ 若 finddata 大 于 根 结 点 关键 码 ,查找 将 在 以 右 儿 子 为 根 的 子 树 上 继续 进行 , 转 (1) 。 

向 二 又 排序 树 中 插入 一 个 结 点 的 过 程 是 : 设 待 插入 结 点 的 关键 码 为 newdata, 为 将 其 插 
入 , 先 在 二 又 排序 树 中 进行 查找 , 若 查找 成 功 , 则 不 用 插入 ; 查找 不 成 功 时 , 则 搬入 该 数据 。 
因此 ,新 插入 的 结 点 一 定 是 作为 叶子 结 点 添加 上 去 的 。 构 造 一 棵 二 又 排序 树 正 是 从 无 到 有 
逐个 查找 并 且 插 入 新 结 点 的 过 程 。 

图 10-5 是 二 又 排序 树 的 查找 过 程 和 插 和 人 数据 示意 图 。 
假如 查找 52, 则 在 第 四 次 比较 时 成 功 , 也 就 是 该 数据 所 在 
的 层次 。 假 如 查找 42 ,在 38 处 失败 ,因为 38 没有 右 儿 子 ， 
说 明 该 结构 中 没有 该 数据 ,那么 就 把 42 插入 在 38 的 右 儿 
子 的 位 置 上 。 显 然 , 没 有 引起 数据 移动 。 这 样 的 思路 使 得 
该 结构 中 不 会 有 相同 的 数据 多 次 出 现 ,只 适合 主 关键 码 的 
查找 。 

图 10-5 二 叉 排 序 树 的 查找 和 由 于 使 用 链表 表示 二 叉 树 的 结 点 ,那么 它 的 定义 和 二 
插入 数据 示意 图 叉 树 的 链接 存储 一 样 。 
对 给 定 序列 建立 二 叉 排 序 树 , 若 左 、 右 子 树 均匀 分 布 ， 
则 其 查找 过 程 类 似 有 序 表 的 折 半 查找 。 特 殊 情 况 是 给 定 序列 原来 就 有 序 或 接近 有 序 , 则 此 
时 建立 的 二 叉 排序 树 就 可 能 演变 为 单 链表 (全 部 是 右 儿 子 或 全 部 是 左 儿子 或 类 似 情 况 ) ,其 
查找 效率 退化 为 顺序 查找 , 即 为 O(n)。 因 此 ,必须 设法 解决 这 个 问题 。10. 4 节 探 讨 这 个 
问题 。 


10.4 平衡 二 叉 树 与 相应 的 查找 技术 


从 10.3 节 发 现 , 按 照 输 入 数据 的 次 序 建立 二 又 排序 树 , 可 能 会 出 现 左 右 层 数 很 不 平衡 
的 现象 。 为 了 解决 这 个 问题 ,采用 插入 数据 时 同时 考虑 平衡 性 的 问题 。 下 面 介 绍 其 改进 后 
的 数据 结构 。 

平衡 二 又 树 (AVL 树 ) 或 者 是 一 棵 空 树 ,或 者 是 具有 下 列 性 质 的 二 叉 排序 树 : 它 的 左 子 
树 和 右 子 树 都 是 平衡 二 又 树 , 且 左 子 树 和 右 子 树 高 度 之 差 的 绝对 值 不 超过 1。 

它 也 是 一 个 递归 定义 ,由 苏联 数学 家 Adelse-Velskil 和 Landis 在 1962 年 提出 。 

图 10-6 给 出 了 两 棵 同一 批 数据 构成 的 二 叉 排序 树 ,每 个 结 点 旁边 所 注 的 数字 是 以 该 结 
点 为 根 的 树 中 左 子 树 与 右 子 树 的 高 度 之 差 ,这 个 数字 称 为 结 点 的 平衡 因子 。 由 平衡 二 叉 树 
的 定义 可 知 ,所 有 结 点 的 平衡 因子 只 能 取 一 1、0、1 三 个 值 之 一 。 

若 二 叉 排 序 树 中 存在 这 样 的 结 点 ,其 平衡 因子 的 绝对 值 大 于 1, 这 棵 树 就 不 是 平衡 二 叉 
树 。 平 衡 二 又 树 不 一 定 是 完全 二 又 树 。 
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(a) 非 平 衡 二 又 树 (b) 平衡 二 又 树 
图 10-6 平衡 二 又 树 的 示意 图 


34 作为 根 , 左 儿子 中 最 大 只 有 2 层 , 而 右 儿子 中 最 大 层次 为 5, 很 不 平衡 。 根 据 二 叉 排序 
树 的 查找 过 程 来 看 ,最 耗 时 的 查找 过 程 就 是 最 深 分 支 的 层次 。 如 果 能 做 到 左右 层 数 尽量 平衡 ， 
二 叉 树 总 的 层 数 必然 降低 ,也 就 是 说 在 二 叉 排 序 树 的 基础 上 调整 之 后 可 以 提高 查找 效率 。 

在 平衡 二 又 树 上 插入 或 删除 结 点 后 ,可 能 使 二 叉 树 失去 平衡 ,因此 ,需要 对 失去 平衡 的 
二 叉 树 进行 平衡 化 调整 。 如 插入 操作 一 定 要 处 理 其 根 离 插 入 结 点 最 近 , 且 平衡 因子 绝对 值 
大 于 1 的 子 树 。 最 小 不 平衡 子 树 就 是 只 要 把 最 小 不 平衡 子 树 转 换 成 平衡 子 树 , 整 棵 二 叉 树 
就 重新 变 成 了 平衡 二 叉 树 。 

对 于 失去 平衡 的 最 小 子 树 根 结 点 ,对 该 子 树 进行 平衡 化 调整 ,有 以 下 4 种 情况 : 左 左 类 
旋转 , 右 右 类 旋转 、 左 右 类 旋转 、 右 左 类 旋转 。 图 10-7 是 平衡 过 程 前 3 种 的 示意 图 。 读 者 可 
自行 给 出 右 左 类 旋转 的 示意 图 。 


D2 已 的 : 632 
YW! > 如 G3)-1 a (3-1 人 福 的 ) 
G20 So 图。 Do Gyo (6)o Co Wo Bo Wo 


(a) 左 左 类 (b) 右 右 类 (©) 左右 类 
图 10-7 平衡 过 程 的 示意 图 


在 平衡 树 上 进行 查找 的 过 程 和 二 叉 排序 树 完全 相同 ,查找 过 程 中 和 给 定 值 进行 比较 的 
次 数 不 会 超过 树 的 深度 ,因此 在 平衡 树 上 进行 查找 的 时 间 复 杂 度 为 O(log,n)。 
【程序 源码 10-2】 平衡 二 又 树 的 基本 操作 部 分 源码 如 下 。 


# include < stdio.h> 

# include < stdlib.h> 
# include < iostream.h> 
# include < iomanip.h> 
# include < windows.h> 
#define TRUE 1 

# define FALSE 0 


const int Lbalance= 1; // 左 高 

const int Ebalance = 0; // 等 高 

const int Rbalance= —1; // 右 高 

int taller = 0; //taller 反映 T 长 高 与 否 
int shorter = 0; //shorter 反映 T 变 矮 与 否 


// 二 又 排序 树 中 结 点 的 对 象 设计 
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class BSTNode{ 


publics 
int data; // 结 点 值 
int balancefactor; // 结 点 的 平衡 因子 


BSTNode * lchild, * rchild; 

}; 

// 二 叉 排 序 树 的 对 象 设计 

class balancetree{ 

public: 
BSTNode * CreatNode( int nodeValue); 
void PreOrder(BSTNode * T); 
void InOrder(BSTNode * T); 
void postOrder (BSTNode * T); 
BSTNode * R Rotate(BSTNode * p); 
BSTNode * L Rotate(BSTNode * p); 
BSTNode * LeftBalance(BSTNode * T); 
BSTNode * RightBalance(BSTNode * T); 
BSTNode * InsertRVL(BSTNode * T, int e); 
BSTNode * LeftBalancel(BSTNode* p); 
BSTNode * RightBalancel(BSTNode * p); 
BSTNode * Delete(BSTNode * q, BSTNode * r); 
BSTNode * DeleteAVL(BSTNode * p, int e); 
BSTNode * BuildTree(BSTNode* r); 
void PrintBSTree(BSTNode * p, int i); 

}; 

BSTNode * balancetree::R_Rotate(BSTNode * p) 

{ 


BSTNode * 1c; // 声 明 BSTNode * 临时 变量 
lc=p->1child; //1c 指向 的 * p 的 左 子 树 根 结 点 
p->1child= lc->zrchild; //1c 的 右 子 树 挂 接 为 * p 的 左 子 树 
lc->rchild=p; 

p=1c; //p 指向 新 的 根 结 点 

return p; // 返 回 新 的 根 结 点 


. 
BSTNode * balancetree::L Rotate(BSTNode* p) 


{ 


BSTNode * rc; // 声 明 BSTNode * 临时 变量 
rc=p->rchild; //rc 指向 的 * p 的 右 子 树 根 结 点 
p->rchild= rc 一 > lchild' //rc 的 左 子 树 挂 接 为 *p 的 右 子 树 
rc->1child=p; 

p=re; //p 指向 新 的 根 结 点 

return p; // 返 回 新 的 根 结 点 


} 
BSTNode * balancetree: :LeftBalance(BSTNode * T) 


{ 
BSTNode * lc, * rd; 


lc=T->1child; //lc 指向 x 了 的 左 子 树 根 结 点 
switch(lc —> balancefactor) // 检 查 *T 的 左 子 树 平衡 度 
// 并 做 相应 的 平衡 处 理 


case Lbalance: 
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// 新 结 点 插入 在 * 了 的 左 孩 子 的 左 子 树 上 ,要 做 单 右 旋 处 理 
T—-> balancefactor = lc 一 > balancefactor = Ebalance; 
T=R Rotate(T); 
break; 
case Rbalance: 
// 新 结 点 插入 在 * 了 的 左 孩 子 的 右 子 树 上 ,要 做 双 旋 处 理 
rd=1c->rchild; //rd 指 向 *T 的 左 孩 子 的 右 子 树 根 
Switch(rd 一 > balancefactor) 
// 修 改 *T 及 其 左 孩子 的 平衡 因子 
{ 
case Lbalance: 
T-> balancefactor = Rbalance; 
lc ->balancefactor = Ebalance; 
break; 
case Ebalance: 
T->balancefactor = lc ~ > balancefactor = Ebalance; 
break; 
case Rbalance: 
T-> balancefactor = Ebalance; 
lc -> balancefactor = Lbalance; 
break; 
} 
rd 一 > balancefactor = Ebalance; 
T->1child=L Rotate(T -> lchild); 


// 对 *T 的 左 孩子 做 左旋 平衡 处 理 
T=R Rotate(T); 
// 对 *T 做 右 旋 处 理 

' 

return T; 


} 
BSTNode * balancetree: :RightBalance(BSTNode * T) 


{ 
BSTNode * rc * ld; 


rc=T->rchild; //rc 指向 *T 的 右 子 树 根 结 点 

switch(rc -> balancefactor) // 检 查 * 了 的 右 子 树 平衡 度 

// 并 做 相应 的 平衡 处 理 

{ 

case Rbalance: // 新 结 点 插入 在 *T 的 右 孩子 的 右 子 树 上 
// 要 做 单 右 旋 处 理 


T->balancefactor = rc 一 > balancefactor = Ebalance; 
T=L Rotate(T); 
break; 
case Lbalance: // 新 结 点 插入 在 *T 的 右 孩子 的 左 子 树 上 
// 要 做 双 旋 处 理 
ld=rc->lchild; //1d 指向 *T 的 右 孩 子 的 左 子 树 根 
switch(1d— > balancefactor) 
// 修 改 *T 及 其 右 孩 子 的 平衡 因子 
{ 
case Lbalance: 
T-> balancefactor = Lbalance; 
Tc 一 > balancefactor = Ebalance; 
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break; 
case Ebalance: 
T->balancefactor = rc 一 >balancefactor = Ebalance; 
break; 
case Rbalance: 
T-> balancefactor = Ebalance; 
rc 一 >balancefactor = Rbalance; 
break; 
} 
ld->balancefactor = Ebalance; 
T->rchild=R Rotate(T—>rchild); 
// 对 *T 的 右 孩子 做 右 旋 平 衡 处 理 
T=L Rotate(T); 
// 对 *T 做 左旋 处 理 
} 
return T; 


} 
图 10-8 为 平衡 二 又 树 功能 图 。 
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(a) 构建 平衡 二 又 树 (b) 中 根 遍 历 (©) 后 根 遍历 
10-8 平衡 二 又 树 功 能 图 


从 建立 过 程 可 以 看 出 ,输入 的 五 个 数据 从 小 到 大 ,如 果 按 照 二 叉 排 序 树 的 构建 思路 , 必 
然 成 为 往 右边 发 展 的 单 枝 二 叉 树 ,查找 效率 回落 到 线性 表 , 但 是 现在 重新 按照 平衡 二 又 树 的 
思路 进行 构建 ,其 层次 降 为 3 ,平衡 因子 都 在 正常 范围 内 ,对 于 查找 效率 的 提升 有 了 很 好 的 
保障 。 


10.5 ” 哈 希 表 结 构 的 查找 技术 


10.5.1 哈 项 表 的 定义 和 构成 


前 面 介绍 的 查找 技术 都 有 一 个 共同 点 ,都 是 基于 “比较 ”操作 ,也 就 是 通过 多 次 比较 来 发 
现 是 否 找 到 或 查找 失败 ,时 间 复 杂 度 从 O(n) 下 降 到 了 O(logzn) ,时 间 效 率 已 经 大 大 提高 。 
计算 机 科学 家 们 并 不 满足 ,希望 能 推出 更 低 时 间 复 杂 度 的 算法 ,如 时 间 复 杂 度 为 0(1) 级 的 
算法 。 
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在 一 批 数 据 中 查找 一 个 特定 的 数据 ,用 O(1) 级 的 算法 就 能 够 完成 查找 这 是 很 难 想象 
的 ,因为 这 意味 着 查找 时 间 和 数据 量 无 关 。 研 究 表 明 , 采 用 基于 比较 的 算法 ,无 法 突破 
Odogsn) 的 时 间 复 杂 度 。 

如 果 深 夜 回 到 停电 的 家 ,马上 就 会 感到 乱 套 了 ,平时 很 顺手 的 东西 很 难 找 到 , 想 去 某 个 
地 方 也 可 能 发 生 碰撞 。 对 盲人 来 说 则 没有 这 个 问题 ,他 可 以 随意 走 到 自己 希望 去 的 地 方 、 拿 
到 自己 想 要 的 东西 。 这 是 为 什么 呢 ? 因 为 盲人 采用 了 “定位 放置 "的 生活 方式 ,就 是 把 东西 
放 在 相对 固定 的 位 置 ,而 在 家 中 以 某 个 地 方 为 出 发 点 到 任何 其 他 地 方 的 方向 . 步 数 和 需要 在 
哪里 拐弯 等 信息 早已 熟 记 于 心 。 

计算 机 科学 家 根据 这 个 原理 ,联想 到 把 数据 固定 存放 在 特定 的 空间 中 ,在 需要 的 时 候 直 
接 到 那个 单元 去 读 取 。 如 果 能 做 到 这 一 点 ,时 间 复 杂 度 就 是 O(1) ,因为 这 个 过 程 只 有 读 取 
数据 的 操作 ,并 没有 启用 循环 和 比较 等 操作 。 必 须 考虑 两 点 : 第 一 是 重新 设计 数据 结构 ,第 
二 是 设计 出 不 用 比较 的 查找 方法 。 

计算 机 科学 家 最 终 决 定 使 用 函数 ,利用 函数 计算 出 数据 应 该 存放 的 地 址 , 存 入 数据 ,在 
需要 查找 数据 的 时 候 还 是 用 同样 的 函数 。 

如 果 通 过 函数 来 计算 数据 的 存放 地 址 ,那么 数据 之 间 的 关系 存储 了 吗 ? 答案 是 没有 。 

这 就 是 第 四 类 逻辑 结构 , 即 “ 集 合 "。 前 面 提 到 的 三 大 类 数据 结构 (线性 表 、 树 、 图 ) 都 是 
对 数据 之 间 内 部 关系 非常 敏感 的 。 在 软件 开发 中 ,还 会 有 种 内 部 结构 为 松散 关系 的 数据 结 
构 , 那 就 是 把 一 批 数 据 作为 一 个 整体 ,只 关注 某 个 数据 是 否 在 其 中 ,也 就 是 查找 操作 , 称 为 
“集合 ”"。 对 于 集合 来 说 ,既然 对 它 内 部 数据 关系 并 不 敏感 , 那 就 可 以 不 处 理 这 些 关系 信息 ， 
而 仅仅 设法 提高 查找 效率 即 可 。 

把 上 述 思 路 小 结 一 下 : 第 一 ,数据 结构 采用 “集合 ”; 第 二 ,定位 放置 采用 “函数 ”。hash 
有 “随机 分 散布 局 .杂凑 技术 ”等 意思 ,和 上 面 的 思路 比较 吻合 ,计算 机 科学 家 把 这 种 利用 函 
数 计算 存储 地 址 的 集合 结构 称 为 hash table, 音 译 就 是 “ 哈 希 表 ”, 中 译 称 为 “杂凑 表 ”。 利 用 
这 种 结构 进行 查找 的 技术 称 为 “ 哈 希 查找 法 ?或 “ 散 列 查找 法 ”。 

例 10-1 线性 表 为 (18.75,60,43,54,90,46) , 哈 希 函数 为 position(key) 二 key mod 13。 
存储 单元 的 地 址 是 0 到 12 ,使 用 数组 实现 这 些 地 址 正好 是 下 标 ,再 次 看 到 数组 中 有 0 下 标 


的 好 处 。 
图 10-9 为 该 批 数 据 用 求 模 函 数 计算 哈 希 地 址 示意 图 。 
0 1 2 3 4 5 67 891 1 1 
hashtable 54 43 | 18 46 | 60 75 90 


图 10-9 求 模 函 数 计算 哈 希 地 址 示意 图 


如 果 要 查找 75, 只 要 计算 75%13, 得 到 存储 地 址 是 10, 到 该 位 置 读 取 数据 即 可 ; 如 果 要 
查找 的 是 50, 计 算 50%13 后 ,地 址 为 11 ,那么 通过 特殊 标志 位 判断 为 查找 失败 。 但 是 按照 
地 址 中 必 有 数据 的 属性 ,这 里 的 特殊 标志 位 的 设计 并 不 理想 ,下 面 将 会 看 到 这 种 方案 的 
改进 。 

这 种 存储 方法 并 不 是 顺序 存储 ,虽然 存储 空间 连续 ,但 是 数据 并 没有 连续 存放 ,也 不 是 
链接 存储 ,因为 存储 位 置 随机 :但 是 并 没有 启用 链表 指针 。 数 据 仅 存 储 在 一 片 内 存 空间 中 ， 
并 没有 额外 地 存储 一 批 管理 数据 ,所 以 也 不 是 索引 存储 。 
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选取 某 个 函数 ,依照 该 函数 按 关键 码 计算 元 素 的 存储 位 置 . 并 按 此 存放 ; 查找 时 ,由 同 
一 个 函数 对 给 定 值 finddata 计算 地 址 ,之 后 在 相应 的 地 址 单元 中 读 取 该 元 素 , 这 就 是 哈 希 查 
找 法 。 哈 希 查找 法 使 用 的 地 址 计算 函数 称 为 哈 希 函数 (杂凑 函数 ) , 按 此 构造 的 表 称 为 哈 
希 表 。 

显然 ,上 面 的 范例 是 一 种 理想 情况 ,所 有 数据 正好 都 占用 了 不 同 地 址 , 哈 希 方法 通常 用 
在 较 大 的 数据 需求 空间 下 使 用 较 小 的 实际 空间 存储 ,而 将 大 空间 地 址 压缩 存储 到 小 空间 中 ， 
地 址 计算 就 无 法 避免 重复 的 相同 结果 。 这 种 情况 称 为 “冲突 ”(Collision) ,映射 到 同一 个 哈 
希 地 址 上 的 关键 码 称 为 “同义词 "。 实 用 编程 应 用 中 冲突 是 不 可 避免 的 ,只 能 尽量 减少 。 

根据 上 面 的 讨论 ,可 以 看 到 采用 哈 希 方法 需要 解决 以 下 两 个 问题 : 

(1) 构造 好 的 哈 希 函数 。 首 先 要 使 得 所 设计 的 函数 要 尽 可 能 简单 ,易于 计算 和 实现 ,以 
便 提高 求 地 址 的 速度 ; 另外 要 使 所 选 函 数 对 关键 码 计算 出 的 地 址 在 整个 地 址 空间 中 大 致 均 
匀 分 布 , 以 减少 冲突 发 生 的 概率 。 

(2) 制定 解决 冲突 的 方案 。 


10.5.2 常见 的 哈 希 函 数 


常见 的 哈 希 函数 有 如 下 几 种 。 

直接 定 址 法 position (key) 一 numl * key 十 num2(numl .num2 为 常数 )。 这 是 一 个 线 
性 变换 , 即 实际 空间 的 大 小 就 是 期 望 空间 的 大 小 。 优 点 是 不 会 产生 冲突 ,缺点 是 不 符合 大 部 
分 应 用 的 基本 要 求 。 

如 某 大 型 考试 中 学 生 信息 的 快速 查询 ,所 有 学 生 的 编号 是 从 201300000 到 201399999， 
那么 可 以 设计 哈 希 函 数 为 position (key) 王 key 一 201300000 ,地址 就 是 从 0 到 99999 ,可 以 容 
纳 10 万 人 。 

除 留 余数 法 position(key) 王 key mod base ( 它 是 一 个 整数 ) 。 因 为 比较 好 编程 实现 ,这 
种 方法 较为 常用 。 选 取 的 基 base 最 好 是 质数 ,也 可 以 是 不 包含 小 于 20 质 因 子 的 合 数 。 这 
是 因为 希望 能 尽 可 能 地 散 列 。 如 果 选 择 2, 那 么 所 有 偶数 的 地 址 就 全 为 0。 

乘 余 取 整 法 。 和 上 面 的 方法 相反 ,还 可 以 取 position (key) = Lnum2 * (numl * key 
mod 1)| (numl num2 均 为 常数 . 且 0 二 num1l 一 1.num2 为 整数 )。 以 关键 码 key 乘 以 
numl, 取 其 小 数 部 分 (numl * key mod 1 就 是 取 numl * key 的 小 数 部 分 ) ,之 后 再 用 整数 
num2 乘 以 这 个 值 , 取 结果 的 整数 部 分 作为 哈 希 地 址 。 该 方法 即 为 乘 余 取 整 法 ,其 中 num2 
取 什 么 值 并 不 关键 ,但 numl 的 选择 却 很 重要 ,最 佳 的 选择 依赖 于 关键 码 集 合 的 特征 。 一 般 
取 numl 王 0.6180339 , 即 黄金 分 割 点 较为 理想 。 

例 10-2 ”如 果 numl= 0.618,num2 二 8,key 王 35 ,那么 0.618X35 一 21. 63 ,而 0.63X8 一 
5. 04, 再 向 下 取 整 数 ,最 后 的 地 址 就 是 5。 

数字 分 析 法 。 有 时 为 了 提高 时 间 效 率 ,减少 计 算 量 ,编程 者 通过 对 数据 的 分 析 , 找 到 均 
匀 分 布 的 几 个 位 置 ,然后 选择 即 可 ,这 就 是 数字 分 析 法 。 

图 10-10 是 数字 分 析 法 的 范例 。 图 中 是 一 批 考生 的 考 号 , 方 框 中 的 数据 是 待 存储 的 一 
部 分 ,显然 期 望 数据 空间 很 大 ,但 是 已 知 实际 考试 人 数 不 足 1000 人 ,所 以 一 个 1000 个 单元 
的 数组 就 足够 。 地 址 从 0 到 999。 上 面 是 位 秆 编号 ,经 过 分 析 , 选 择 了 7,11,13 这 三 位 作为 
哈 希 的 结果 ,右边 是 最 后 经 过 选择 的 位 置 所 造成 的 地 址 。 
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平方 取 中 法 。 有 时 使 用 数字 分 析 法 也 找 不 到 很 好 的 散 列 方案 ,可 以 对 关键 码 进行 一 些 
计算 比如 平方 后 ,再 按 数字 分 析 法 求 哈 希 地 址 ,这 就 是 平方 取 中 法 。 

图 10-11 是 平方 取 中 法 的 示意 图 。 第 一 组 的 数字 4 位 长 ,需要 哈 希 到 3 位 长 的 地 址 空 
间 中 ,没有 理想 的 方案 。 平 方 后 再 讨论 就 可 以 发 现 2、3、4 位 还 是 比较 理想 的 。 


1234567 8901 23 4 


2005203 1685 |34|2| 354 
2005208 |6428 |15|9 | 885 
2005201 |9657 |12|2| 172 
2005206 8239 |81|6 | 691 0100 00 10 000 010 
2005209 |9531 |59|4 | 919 1100 | |1210 000| |210 
1200 14 40 000 440 
2005202 |8258 |53 |4 | 283 
1160 13 70 400 | |370 
2005206 |7582 |69|1 | 629 2061 4 10 541 310 
2005200 “|9235 |84 |6 | 054 key key: 哈 希 地 址 
图 10-10 ”数字 分 析 法 的 示意 图 10-11 平方 取 中 法 的 示意 图 


折 友 法 (Folding)。 将 关键 码 自 左 到 右 分 成 位 数 相等 的 几 部 分 ,最 后 一 部 分 位 数 可 以 短 
些 , 然 后 将 这 几 部 分 每 加 求 和 ,并 按 哈 希 表 表 长 , 取 后 几 位 作为 哈 希 地 址 。 这 种 方法 称 为 折 
全 法 。 有 以 下 两 种 释 加 方法 。 

(1) 移 位 法 。 将 各 部 分 的 最 后 一 位 对 齐 相 加 。 

(2) 间 界 从 加 法 。 从 一 端 向 另 一 端 沿 各 部 分 分 界 来 回 折 双 后 ,将 最 后 一 位 对 齐 相 加 。 

例 10-3 设 关键 字 为 某 人 身份 证 号 码 430104681015355, 则 可 以 用 4 位 为 一 组 进行 到 
加 , 即 有 5355 十 8101 十 1046 十 430 一 14 932, 合 去 高 位 后 , 则 有 position(430104681015355) 一 
4932, 即 为 该 身份 证 关键 字 的 散 列 函数 地 址 。 


10.5.3 哈 希 表 的 查找 过 程 和 冲突 解决 方法 


哈 希 表 的 查找 过 程 和 造 表 过 程 基本 相同 。 一 些 关键 码 可 通过 哈 希 函数 求 得 的 地 址 直接 
找到 , 另 一 些 关键 码 在 哈 希 函数 得 到 的 地 址 上 产生 了 冲突 ,需要 按 处 理 冲突 的 方法 进行 查 
找 。 在 几 种 处 理 冲 突 方法 中 ,产生 冲突 后 的 查找 仍然 是 给 定 值 与 关键 码 进行 比较 的 过 程 ,所 
以 如 果 冲 突 过 多 ,整体 查找 时 间 效 率 将 下 降 。 最 极端 的 情况 是 所 有 的 数据 都 产生 地 址 冲突 ， 
那么 查找 过 程 将 退回 到 线性 表 的 顺序 查找 。 

哈 希 表 的 装填 因子 a 定义 为 

a 一 填 人 表 中 的 元 素 个 数 / 哈 希 表 的 长 度 
由 于 表 长 是 定 值 , 与 填 人 表 中 的 元 素 个 数 成 正比 ,所 以 ,a 越 大 , 填 人 表 中 的 元 素 越 多 ,产生 
冲突 的 可 能 性 就 越 大 ; a 越 小 , 填 入 表 中 的 元 素 越 少 ,产生 冲突 的 可 能 性 就 越 小 。 

查找 过 程 中 ,关键 码 的 比较 次 数 取 决 于 产生 冲突 的 多 少 , 产 生 的 冲突 少 , 查 找 效 率 就 高 ， 
产生 的 冲突 多 ,查找 效率 就 低 。 因 此 .影响 产生 冲突 的 因素 ,也 就 是 影响 查找 效率 的 因素 。 

影响 产生 冲突 多 少 有 以 下 3 个 因素 : 哈 希 函数 是 否 均匀 、 处 理 冲 突 的 方法 以 及 哈 希 表 
的 装填 因子 。 分 析 这 3 个 因素 ,尽管 哈 希 函数 的 “好 坏 ? 直 接 影 响 冲突 产生 的 频 度 。 一 般 情 
况 下 ,可 以 不 考虑 哈 希 函数 对 平均 查找 长 度 的 影 
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下 面 介 绍 几 种 常见 的 处 理 冲突 的 方法 。 

1. 开放 定 址 法 

由 关键 码 得 到 的 哈 希 地 址 一 旦 产生 了 冲突 ,就 去 寻找 下 一 个 空 的 哈 希 地 址 ,只 要 哈 希 表 
足够 大 , 空 的 哈 希 地 址 总 能 找到 ,并 将 数据 元 素 存 人 。 寻 找 空 哈 希 地 址 的 方法 很 多 ,下 面 主 
要 介绍 3 种 : 线性 探测 法 、 二 次 探测 法 、 双 哈 希 函数 探测 法 。 

(1) 线性 探测 法 

Hi = (position (key) 十 addi) mod length (1 三 i< length) 
其 中 ,position (key) 为 哈 希 清 数 ; length 为 喻 希 表 长 度 ; add; 为 增 量 序列 1,2,… ,length 一 1， 
有 addi=i,。 

例 10-4 关键 码 集 为 {47,7,29.11,16,92,22,8,3) ,了 哈 希 表 表 长 为 11,position (key) 一 
key mod 11, 用 线性 探测 法 处 理 冲 突 的 示意 图 如 图 10-12 所 示 , 用 圈 标 注 的 为 冲突 后 所 产生 
的 相应 地 址 。22 和 11 冲突 ,3 和 47 冲突 ,29 和 7 冲突 。 之 后 8 的 地 址 被 29 占用 ,只 能 存 人 
9 号 地 址 。 

10 


2 
8 


0 二 3 4 7 
'{2) | rls) 
a 7 No7 


hashtable 


we 


图 10-12 线性 探测 法 的 示意 图 


线性 探测 法 可 能 使 本 应 该 存在 第 i 个 喻 希 地 址 的 同义词 存 人 到 第 i 十 1 个 喻 希 地 址 ,这 
样本 应 存 人 第 i 十 1 个 哈 希 地 址 的 元 素 可 能 变 成 了 第 i 十 2 个 哈 希 地 址 的 同义词 ,如 此 下 去 可 
能 出 现 很 多 元 素 在 相 邻 的 喻 希 地 址 附近 “堆积 ”, 降 低 了 散 列 效果 ,也 就 降低 了 查找 效率 。 为 
此 可 采用 二 次 探测 法 ,或 双 哈 希 函数 探测 法 ,以 改善 “堆积 ?的 副作用 。 

(2) 二 次 探测 法 

Hi = ( position (key) 十 addi) mod length 
其 中 ,position(key) 为 哈 希 函数 ; length 为 哈 希 表 长 度 , 要 求 是 某 个 4k 十 3 的 质数 (k 是 整 
数 ); add; 为 增 量 序列 12, 一 12,22, 一 22,… ,10i 十 2, 一 (10i 十 2) 。 

(3) 双 哈 希 函 数 探测 法 。 双 哈 希 函数 探测 法 是 先 用 第 一 个 函数 position(key) 对 关键 码 
计算 哈 希 地 址 ,一 旦 产生 地 址 冲突 ,再 用 第 二 个 函数 ReHash(key) 确 定 移动 的 步 长 因子 ,最 
后 通过 步 长 因子 序列 由 探测 函数 寻找 空 的 哈 希 地 址 。 

Hi = (position(key) 十 ix* ReHash(key))mod length 〈i 一 1,2.…,length 一 1) 

其 中 ,position(key) ,ReHash(key) 分 别 是 第 一 次 和 冲突 后 使 用 的 两 个 哈 希 函 数 ; length 为 
哈 希 表 长 度 。 如 , position (key) 二 addressl 时 产生 地 址 冲突 ,就 计算 ReHash (key) 一 
address2 , 则 探测 的 地 址 序列 为 

Hi = (addressl 十 address2) mod length 

H; = (addressl 十 2*address2) mod length 


He。 = (addressl+ ( length 一 1) *address2) mod length 


2. 挂 链 法 
使 用 链表 来 处 理 冲突 数据 是 一 个 很 好 的 方法 ,体现 了 链表 存储 的 优点 ,需要 的 时 候 临 时 
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申请 ,没有 浪费 。 编 程 时 要 设计 一 个 指针 数组 ,在 处 理 冲 突 时 ,与 插入 位 置 先后 无 关 , 但 也 可 
以 排 成 有 序 状 态 ,这 样 也 可 以 提高 查找 效率 。 

例 10-5 ”线性 表 为 (18,62,60,43,67,90,54,46,75)。 哈 希 函 数 设 计 为 position(key) 王 key 
mod 13。 

图 10-13 是 该 批 数据 使 用 挂 链 法 解决 冲突 的 示意 图 。 为 了 编程 使 用 最 少 的 语句 ,把 新 
出 现 的 结 点 挂 在 最 上 面 ,和 栈 的 进 栈 操作 类 似 ,其 特点 是 最 新 找 不 到 的 数据 下 次 会 最 快 找 
到 。 如 果 采 用 挂 在 最 下 面 的 方法 , 则 先进 入 的 数据 下 次 依旧 应 该 先 找到 。 如 果 保 持 数据 的 
升序 ,在 链表 中 间 的 特定 位 置 就 可 以 结束 查找 ,不 一 定 非 要 把 该 链 的 所 有 数据 都 遍历 完毕 才 
失败 。 
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图 10-13 ” 挂 链 法 的 示意 图 


3， 建立 公共 溢出 区 

哈 希 函数 最 大 程度 解决 了 一 次 性 查找 成 功 的 效率 问题 ,而 数据 内 部 关系 又 不 敏感 ,那么 
也 设计 一 个 公共 溢出 区 ,不 论 是 哪个 数据 产生 了 地 址 冲突 都 存放 其 中 。 如 果 发 生 冲 突 , 则 进 
和 此 部 分 逐一 比较 ,直到 查找 成 功 或 者 失败 后 才 存 人 该 数据 。 放 置 第 一 次 数据 的 空间 称 为 
“基本 表 ”, 而 其 他 所 有 冲突 的 数据 所 在 的 空间 称 为 “溢出 表 ”。 溢 出 表 中 的 数据 可 以 在 进入 
时 保持 有 序 ,那么 在 进入 溢出 表 之 后 还 可 以 采用 折 半 查找 法 提速 。 

哈 希 方法 是 一 种 奇特 的 查找 方法 , 它 不 以 比较 为 基本 操作 ,而 是 通过 函数 计算 产生 存储 
地 址 。 其 查找 速度 快 ,也 比较 节省 空间 ,但 只 适合 不 需要 处 理 内 部 数据 关系 的 情况 。 它 的 特 
点 是 ,即使 有 部 分 数据 地 址 冲突 ,最 终 查 找 效率 依然 很 高 ,接近 于 O(1)。 

【程序 源码 10-3】 下 面 为 哈 希 表 查 找 的 部 分 源码 。 


// 哈 希 查找 法 

# include < iostream.h> 
# include < windows.h> 
# include < iomanip.h> 


#define datawidth 5 // 设 置 数据 显示 宽度 

# define arraymaxnum 21 // 约 定数 组 大 小 : 0 号 单元 默认 不 用 , 故 用 户 数 
// 据 可 以 接收 20 个 

#define defaultnum 10 // 约 定 默认 数据 数组 大 小 ,数据 使 用 教材 实际 范例 

# define modvalue 13 // 约 定 哈 希 函数 取 模 的 值 


int defaultdata[ defaultnum] = {0,18,62,60,43,67,90,54,46,75}; 
//0 号 下 标 默认 不 用 , 故 存 0 
int flag= 0; //0 表示 没有 数据 ,1 表示 有 数据 
// 结 点 对 象 设计 
class node 
{ 
friend class hash; 
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int data; // 数 据 
node * next; // 结 点 
}; 
// 哈 希 表 对 象 设计 
class hash 
{ 
private: 
node * hashtable[ modvalue]; // 蛤 希 表 大 小 不 变 , 由 模 确 定 ,0 一 ( 模 一 1) 
public: 
int times; // 比 较 次 数 
hash(); // 构 造 函数 
~hash(); // 析 构 函 数 
void setarraynull(); // 把 数组 所 有 单元 开始 设置 为 空地 址 
void freenodespace( ); // 释 放下 挂 所 有 结 点 的 空间 
void displayarraydata( int * data, int length); // 显 示 默 认 或 输入 的 数据 数组 
void hashanumber(int number) // 哈 希 一 个 数据 到 哈 希 表 
void displayhashtable(void) ; // 显 示 哈 希 表 
void displaytimes(void); // 显 示 比 较 次 数 
int hashsearching( int seekdata) ; // 哈 希 查找 seekdata 
}; 
void hash: :hashanumber(int number) // 险 希 一 个 数据 到 哈 希 表 
{ 
int position; 
node * newnodep; 
newnodep = new node; // 此 处 对 于 申请 失败 并 没有 处 理 
newnodep 一 > data = number; // 把 新 数据 存 人 新 申请 的 结 点 
newnodep — > next = NULL; // 置 空地 址 域 
position = number % modvalue; // 产 生 哈 希 地 址 
if(hashtable[ position] == NULL) // 该 地 址 为 空 说 明 下 面 没有 挂 结 点 
hashtable[ position] = newnodep; // 直 接 挂 上 该 数据 
else 
{ 
newnodep — > next = hashtable[ position]; 
hashtable[ position] = newnodep; // 挂 在 第 一 个 位 置 上 ,这 样 最 节省 时 间 , 类 似 进 栈 
' 
} 
void hash: :displayhashtable(void) // 显 示 哈 希 表 


{ node * searchp; 
for(int i=0;i<modvalue;i++) 
{ cout << setw(5)<< i<<" "; 
searchp = hashtable[ i]; 
if (searchp == NULL) 
cout <<" 无 数据 "<< end]; 
else 
{ 
while (searchp!= NULL) 
{ 
cout << setw(5)<< searchp— > data <<" "; 
Searchp = searchp 一 > next; 
} 
cout << endl; 
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} 


让 


int hash: :hashsearching( int seekdata) 


{ 


} 


int position; 

node * searchp; 

times= 1; 

position = seekdata % modvalue; 

if (hashtable[ position] == NULL) 
return 0; 

else 
searchp = hashtable[ position]; 
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// 了 哈 希 查找 seekdata 


// 计 数 比较 次 数 ,初始 化 
// 产 生 哈 希 地 址 


// 本 次 返回 0 说 明 该 地 址 没有 任何 数据 


while( (searchp!= NULL) && ( searchp - > data!= seekdata)) 


{ 
timest+; 
searchp = searchp — > next; 
} 
if (searchp!= NULL) 
return position; 
else 
return 0; 


图 10-14 为 哈 希 法 程序 运行 图 。 
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精 输 入 您 要 找 的 数据 : 


FE 在 18 号 地 址 链表 中 。 
人 se 


1/ 计数器 加 1 


// 本 次 返回 0 说 明 该 地 址 下 所 有 结 点 都 查找 完 
// 毕 ,没有 该 数据 


图 10-14 哈 希 法 程序 运行 图 
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10.6 字符 串 结构 的 快速 查找 


前 面 章 节 初步 讨论 了 串 的 匹配 操作 ,介绍 了 逐 位 匹配 全 回溯 算法 (BF 算法 , 即 Brute- 
Force 算法 ) , 它 就 是 每 一 轮 匹 配 失败 后 主 串 string 只 能 向 前 移动 一 个 位 置 , 它 的 缺点 就 是 
时 间 效 率 很 低 。 为 了 提高 匹配 的 时 间 效率 ,本 节 将 介绍 新 的 算法 来 提高 匹配 的 时 间 效 率 。 

例 10-6 设 主 串 string 王 "abcaacdefabcabcaacacbab" ,模式 串 substring 一 "abcaacac"， 
第 一 轮 逐 位 比较 后 在 第 7 位 失败 。 如 果 i 为 主 串 的 位 置 指针 ,j 为 模式 串 的 位 置 指针 ,按照 
逐 位 比较 的 传统 思路 ,此 时 主 串 移动 到 上 一 个 字符 的 下 一 个 , 即 第 2 位 ,模式 串 恢 复 到 第 一 
位 , 即 i 从 7 回溯 到 2,j 从 7 回溯 到 1, 重 新 开始 新 一 轮 逐 位 比较 。 这 就 是 逐 位 回溯 匹配 
算法 。 

由 于 模式 串 第 一 个 字符 是 “a”, 则 在 第 一 轮 第 7 位 失败 时 ,并 不 应 该 从 第 二 位 的 “b” 上 开 
始 比较 ,应 该 把 模式 串 恢复 到 第 一 位 后 ,设法 直接 和 主 串 中 第 4 位 的 “a" 开 始 比较 。i 从 7 回 
溯 到 4,j 从 7 回溯 到 1。 这 就 是 改进 后 的 首位 回溯 匹配 算法 。 详 见 示意 图 10-15 。 

位 置 12345678901234567890123 在 改进 算法 中 应 该 记录 主 串 中 新 出 现 的 和 模式 
下 电 abcaacdefabcabcaacacbab 串 首 字符 相同 的 字符 位 置 。 由 于 在 失败 之 前 主 串 中 


be 可 能 已 经 有 多 次 和 模式 串 首 字母 相同 的 情况 ,为 了 保 

第 三 轮 建议 点 abcaacac ; 

某 轮 匹配 成 功 点 abeaacae ”证 正确 性 ,通过 一 个 标志 位 保证 只 记录 第 一 次 ,而 不 

图 10.15 首位 确定 回 洲 步 数 到 配 算法 “能 采用 刷新 法 记录 每 一 次 负 到 的 和 首 字符 相同 的 字 
未 二 国 符 位 置 , 如 本 例 中 记录 第 5 位 就 是 错误 的 。 如 果 在 匹 


配 中 有 变化 , 则 下 一 轮 的 起 始 位 置 已 经 出 现 。 如 果 没 
有 变化 ,也 无 须 从 第 2 位 开始 比较 ,应 该 用 另 一 个 循环 去 查找 主 串 中 下 一 个 “a” 的 位 置 ,从 那 
个 位 置 开始 。 如 在 第 三 轮 失 败 后 ,i==6,j 二 2, 此 时 如 果 通 过 算法 一 直 找 下 去 ,在 第 10 位 找到 
下 一 个 “a”, 则 i==10,j 二 1, 重 新 开始 。 这 个 算法 虽然 提高 了 一 定 的 时 间 效 率 ,但 是 主 串 还 会 
出 现 一 定 的 回溯 。 

下 面 介 绍 的 经 典 算法 可 以 取消 主 串 回溯 ,可 提高 速度 。 

主 串 无 回溯 匹配 算法 (KMP 算法 ): 这 是 由 克 努 特 (Knuth) 、 莫 里 斯 (Morris) 和 普 拉 特 
(Pratt) 同 时 设计 和 改进 后 的 模式 匹配 算法 , 它 的 主要 思想 分 析 如 下 : 分 析 BF 算法 的 执行 
过 程 , 造成 BF 算法 速度 慢 的 原因 是 “回溯 ”, 即 在 某 轮 的 匹配 过 程 失败 后 ,对 于 主 串 ,要 回 到 
本 轮 起 始 字符 的 下 一 个 字符 ,模式 串 要 回 到 第 一 个 字符 ,而 有 些 回 溯 并 不 是 必要 的 。 

例 10-7 设 主 串 string 二 "ababcabcacbab" ,模式 substring 一 "abcac" ,在 BF 算法 的 第 
三 轮 匹 配 过 程 中 , 主 串 的 第 3 位 到 第 6 位 和 模式 串 的 第 1 位 到 第 4 位 是 匹配 成 功 的 , 主 串 的 
第 7 位 *b” 不 等 于 模式 串 的 第 5 位 *c”, 匹 配 失败 ,因此 进入 第 四 轮 。 其 实 第 四 轮 不 必要 , 因 
为 在 第 三 轮 中 主 串 的 第 4 位 等 于 模式 串 的 第 2 位 ,而 模式 串 的 第 1 位 和 第 2 位 并 不 相等 ,所 
以 必 有 模式 串 的 第 1 位 不 等 于 主 串 的 第 4 位 , 同 理 第 五 轮 也 是 没有 必要 , 故 从 第 三 轮 之 后 可 
以 直接 进入 第 六 轮 。 这 和 上 面 提 到 的 首 字母 确定 回溯 位 置 的 改进 是 类 同 的 。 

进一步 分 析 第 六 轮 , 主 串 的 第 6 位 和 模式 串 的 第 1 位 比较 也 是 多 余 , 因 为 第 三 轮 中 已 经 
比较 过 主 串 的 第 6 位 和 模式 串 的 第 4 位 并 且 相等 ,而 模式 串 的 第 1 位 和 第 4 位 相等 , 必 有 主 
串 第 6 位 和 模式 串 的 第 1 位 相等 ,因此 第 六 轮 比较 可 以 从 第 二 对 字符 即 主 串 的 第 7 位 和 模 
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式 串 的 第 2 位 开始 进行 , 即 第 三 轮 匹配 失败 后 主 串 指针 i 不 动 ,而 是 将 模式 串 向 右 “ 滑 动 ”， 
用 模式 串 第 2 位 “对 准 ” 主 串 第 7 位 继续 比较 即 可 ,以 此 类 推 。 可 以 看 到 ,此 时 主 串 的 位 置 恰 
好 是 刚才 一 轮 匹配 失败 的 位 置 , 即 主 串 指针 i 无 回 滴 。 详 见 示意 图 10-16。 


下 面 通过 形式 化 抽象 讨论 这 种 算法 的 性 质 。 如 果 希 户 人 
某 轮 在 string; 和 substringi 匹配 失败 后 ,指针 i 不 回溯 ,模式 主 串 ababcabcacbab 
串 substring 向 右 “ 滑 动 ” 至 某 个 位 置 上 ,使 得 substringk 对 模式 中 abcac ; 


A BF 算法 第 三 轮 ”abcac 
准 stringi ,继续 向 右 进 行 。 问 题 的 关键 是 模式 串 substring 建议 从 第 7 位 开始 whale 


滑动 到 哪个 位 置 上 ? 不 妨 设 位 置 为 k, 即 string 和 10-16 主 串 无 回 湖 匹 配 算法 
substring 匹配 失败 后 ,指针 i 不 动 , 模 式 substring 向 右 滑 示意 图 
动 , 使 substringk 和 string; 对 准 ,继续 向 右 进 行 比较 ,要 满 
足 这 一 假设 ,就 要 有 如 下 关系 成 立 : 

"stringi strings***stringen" = "substring; wr substring; gra***substring;1" (10-1) 
式 中 右边 是 string; 前 面 的 k 一 1 个 字符 ,而 左边 是 substringk 前 面 的 k 一 1 个 字符 ,本 轮 匹 
配 失败 是 在 string; 和 substringi 之 处 ,已 经 得 到 的 部 分 匹配 结果 是 : 


"substringi substring2"**substring; 1" ="string; jy string; #2""*string 1" (10-2) 
因为 k 一 ij, 所 以 有 : 
"substring; prsubstring; w+2°"*substring; 1" = "string; ww String String (10-3) 


本 式 左 边 是 substringi 前 面 的 k 一 1 个 字符 ,右边 是 string; 前 面 的 k 一 1 个 字符 ,通过 
式 (10-1) 式 和 (10-3) 得 到 关系 : 
"substring substrings*…substringe 1" ="substring; wsubstring; w+2°**substring 1" (10-4) 
结论 : 某 轮 在 string; 和 substringi 匹配 失败 后 ,如 果 模 式 串 中 有 满足 式 (10-4) 的 子 串 
存在 , 即 ,模式 串 的 前 k 一 1 个 字符 与 模式 串 中 第 j 位 前 面 的 k 一 1 个 字符 相等 时 ,模式 串 就 
可 以 向 右 * 滑 动 ”, 使 得 模式 串 的 第 k 位 和 主 串 的 第 i 位 对 准 , 继 续 向 右 进行 比较 即 可 。 此 时 
主 串 的 i 是 没有 移动 的 , 即 没 有 回溯 。 
为 了 能 确定 模式 串 移 动 的 距离 ,下面 讨论 next 函数 。 约 定 模 式 串 从 1 开始 ,第 j 位 表示 
上 一 轮 失 败 的 位 置 , 则 第 j 位 都 对 应 一 个 k 值 , 这 个 k 值 仅 依赖 于 模式 串 本 身 字符 序列 的 构 
成 ,与 主 串 无 关 。 启 用 next[j] 表 示 该 k 值 , 则 next 函数 有 如 下 性 质 : 
(1) k 一 next[j],k 是 一 个 整数 表示 下 标 , 且 0 三 k 二 j。 即 j 的 位 置 决定 了 滑动 距离 ,如 
j 为 当前 模式 串 的 第 5 位 , 则 可 以 移动 的 距离 分 别 有 0、1、2、3、4 等 五 个 。 
(2) 为 了 使 模式 串 的 右 移 不 丢失 任何 匹配 成 功 的 可 能 , 当 存在 多 个 满足 条 件 (10-4) 的 
k 值 时 ,应 取 最 大 值 ,这 样 向 右 滑动 的 距离 最 小 ,滑动 的 实际 字符 距离 为 j 一 k 个 。 如 j 为 当前 
模式 串 的 第 5 位 ,假设 k=2, 则 5 一 2 一 3, 即 把 模式 串 移 动 3 位 , 主 串 指针 不 动 ,继续 下 一 轮 比较 。 
(3) 如 果 模 式 串 第 j 位 之 前 不 存在 满足 条 件 (10-4) 的 子 串 ,此 时 若 模式 串 第 1 位 不 等 于 
模式 串 的 第 j 位 , 则 k= 二 1; 若 模式 串 第 1 位 等 于 模式 串 的 第 j 位 , 则 kk 一 0; 这 时 滑动 的 距离 
最 远 ,为 j 一 1 个 字符 , 即 用 模式 串 的 第 1 位 和 主 串 的 第 j 十 1 位 继续 比较 。 
因此 ,next 函数 的 定义 如 下 : 
0 了 全 于 
max k|1 近 k 志 j 且 满足 式 (13-4) 
1 不 存在 上 面 的 k 且 ti 天 
0 不 存在 上 面 的 k 且 ti 一 


next[j] 一 
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例 10-8 设 有 模式 串 ,substring 一 "abcaababc" . 则 它 的 next 函数 值 如 下 : 


j 123456789 
模式 串 abcaababc 
next[j] 011021311 


下 面 讨论 KMP 算法 。 在 求 得 模式 的 next 函数 之 后 ,匹配 算法 如 下 。 

假设 以 指针 posi 和 subposj 分 别 指示 主 串 和 模式 串 中 的 比较 字符 的 位 置 , 令 posi 的 初 
值 为 任意 一 个 位 置 pos,subposj 的 初 值 为 1。 若 在 匹配 过 程 中 主 串 的 第 posi 位 等 于 模式 串 
的 第 subposj 位 , 则 posi 和 subposj 分 别 增 1, 若 划一 次 匹配 失败 后 , 则 主 串 不 回溯 , 即 posi 
不 变 , 而 subposj 退 到 nextLsubposj] 位 置 再 比较 ,以 此 类 推 。 直 到 遇 到 下 列 两 种 情况 : 一 种 
情况 是 subposj 退 到 某 个 nextLsubposj] 位 置 时 字符 相等 , 则 posi 和 subposj 分 别 增 1 继续 
进行 匹配 ; 另 一 种 情况 是 subposj 退 到 0( 此 处 讨论 的 正常 起 始 位 置 是 1), 则 此 时 posi 和 
subposj 也 要 分 别 增 1, 即 主 串 的 下 一 个 字符 和 模式 串 的 第 一 个 字符 重新 开始 匹配 。 

图 10-17 是 利用 模式 next 函数 进行 匹配 的 过 程 示意 图 。 设 主 串 string 一 
"aabcbabcaabcaababc" , 子 串 substring 一 "abcaababc" 。 


第 一 轮 1i=2 
1234 56 7 89 101112131415161718 
aabcebabceaabcaab abc 
abcaaba be 
next[2]=1 
第 二 轮 1i=2—— 1i=5 
aabecbabecaabecaababe 
abcaaba be 
人 j=1 一 一 hj=4 next[4]=0 
第 三 轮 t=6 — ti=12 
aabcbabcaabcaaba bec 
abcaaba be 
jl -一 4 j=7 next[7]=3 
第 四 轮 ti — + il9 
aabebhiabceaabc aa b a 
abcaaba be 
hj=3 一 一 4 i=10 


10-17 ”利用 模式 next 函数 进行 匹配 的 过 程 示 意图 


下 面 讨论 如 何 求 next 函数 。 
next 函数 值 仅 取决 于 模式 串 substring 本 身 而 和 主 串 string 无 关 。 可 以 从 next 函数 的 
定义 出 发 用 递 推 的 方法 求 得 next 函数 值 。 
由 定义 知 ,next[1]=0. 设 next[j]= 二 k, 即 有 
"substring substring:…substringk 1" ="substring, kw substring ka…substring 1" (10-5) 
那么 next[j 十 1] 会 是 什么 呢 ? 下 面 分 两 种 情况 讨论 : 
第 一 种 情况 : 若 substringi 二 substring; , 则 表明 在 模式 串 中 


"substring: substring:…substringk” 一 "substringj_ wa substringj wz…substring ” (10-6) 
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这 就 是 说 ,next[j 十 1] 二 k 十 1, 即 next[j 十 1] 二 next[j] 十 1。 
第 二 种 情况 : 若 substringx 关 substring; , 则 表明 在 模式 串 中 
"substring substring,*…substrings" "substring; kr substring w+2°**substring"” (10-7) 

此 时 可 把 求 next 函数 值 的 问题 也 看 成 是 一 个 模式 匹配 问题 ,整个 模式 串 既 是 主 串 又 是 
模式 ,而 当前 在 匹配 的 过 程 中 , 式 (10-5) 已 经 成 立 , 则 当 substringx 关 substring; 时 ,应 将 模式 
向 右 滑动 ,使 得 第 next[Lk] 个 字符 和 “ 主 串 ”中 的 第 j 个 字符 相 比较 。 

若 next[kj] 二 k', 且 substringk 一 substringi, 则 说 明 在 主 串 中 第 j 十 1 个 字符 之 前 存在 一 
个 最 大 长 度 为 k' 的 子 串 ,使 得 

"substring substring:…substringk” 一 "substringj_w+l substringj w+z…substring”(10-8) 
因此 ,next[j 十 1] 二 next[k] 十 1。 

同 理 , 若 substringw 闯 substring;, 则 将 模式 继续 向 右 滑动 至 使 第 next[k'] 个 字符 和 
substringi 对 齐 , 以 此 类 推 ,直至 substring; 和 模式 中 的 某 个 字符 匹配 成 功 ,或 者 不 存在 任何 
k (1 过 k' 之 k 达 … 过 j) 满 足 式 (10-8) ,此 时 车 substringi 隆 substringj+1, 则 有 next[j 十 1]=1; 
车 substring =substring;+1 , 则 有 next[j 十 1] 二 0。 

KMP 算法 的 时 间 复 杂 度 是 O(n * m) ,但 在 一 般 情况 下 ,实际 的 执行 时 间 是 O(n 十 m)。 

由 于 涉及 next 函数 的 计算 和 使 用 ,KMP 算法 和 BF 算法 相 比 ,增加 了 很 大 设计 难度 。 

下 面 的 程序 设计 是 最 基本 的 字符 串 匹 配 和 主 串 无 回溯 匹配 的 方法 比较 。 试 图 通过 统计 
各 自 的 比较 次 数 来 确认 无 回溯 法 的 优越 性 ,同时 对 于 字符 串 相 关 程 序 设 计 也 是 一 个 全 面 的 
复习 巩固 。 

【程序 源码 10-4】 BF 算法 和 KMP 算法 的 比较 。 

主要 功能 : 通过 键盘 输入 或 默认 的 字符 串 数组 数据 ,进行 两 种 匹配 算法 ,同时 进行 比较 
量 的 统计 和 对 比 。 下 面 为 部 分 主要 匹配 功能 的 程序 源码 。 


// 主 串 和 模式 串 基 本 操作 

# include < iostream> 

# include < windows.h> 

# define MaxStringLen 100 // 约 定 主 串 和 模式 串 输入 时 字符 串 最 大 长 度 ,启用 0 下 标 
using namespace std; 

enum returninfo{ success, fail, overflow, underflow, range_error}; 


// 定 义 返回 信息 清单 
int flag= 0; // 标 志 位 ,判断 主 串 和 模式 串 是 否 建立 ,没有 为 0, 有 则 为 1 
char defaultmainstring[ ] = "ababcabcacbab" ; 

// 默 认 主 串 
char defaultsubstring[ ] = "abcac"; // 默 认 模式 串 


// 字 符 串 查找 对 象 设计 
class stringlocate 
{ 
friend class interfacebase; 
private: 
char mainstring[MaxStringLen]; // 主 串 字 符 数组 
char substring[MaxStringLen]; // 模 式 串 字符 数组 
int next[MaxStringLen]; //next 数组 
int countl,count2; // 分 别 统 计 两 种 匹配 的 比较 次 序 
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int startposl, startpos2; // 分 别 记录 匹配 成 功 时 起 始 位 置 
int posi, subposj; // 分 别管 理 主 串 和 模式 串 的 当前 位 置 
public: 


stringlocate(){}; 
~stringlocate(){}; 
void showstring(); 
returninfo BFlocating(char * target, char * mode); 
void getnext( ); 
returninfo KMPlocating(char * target, char * mode); 
}; 
returninfo stringlocate: :BFlocating(char * target,char * mode) 
//Brute- Force 匹配 算法 , target 为 主 串 .mode 为 模式 串 
{ 
posi=0, subposj =0; // 设 置 比较 的 起 始 下 标 
count1 = 0; // 计 数 器 清 0 
int mlen = strlen(mode); 
int tLen = strlen(target); 
if(tLen < mlen) 
return fail; 
while ((subposj < mlen) && (posi < tLen)) 
// 两 个 字符 串 数组 都 没有 完 时 一 直 循 环 
{ 
if(target[posi] == mode[ subposj]) 
{ 
posi+t+;subposj++; // 如 果 本 次 字符 相等 , 则 两 个 位 置 标记 都 往 前 移动 
} 
else// 出 现 不 等 时 
{ 
posi = posi - subposj + 1; 
// 主 串 回溯 到 本 轮 起 始 位 置 的 下 一 个 
subposj = 0; // 模 式 串 回溯 到 0 
} 
countl ++; // 计 数 器 记录 每 一 次 比较 
二 
startposl = posi — subposj+1; // 本 轮 匹 配 成 功 的 开始 位 置 (不 是 下 标 ) 
if(subposj > = mlen) // 如 果 模 式 串 先 完 ,说 明 匹 配 成 功 
return success; 
else 
return fail; 
} 
void stringlocate: :getnext() //getnext() 的 实现 
{ 
int j = 1,k=0; 
next[0] = —1; // 定 义 next[0] = -1.next[1] =0 
next[1] = 0; 
int mlen = strlen(substring); 
while(j < mlen) 
’ 


} 
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if((k== -1)||(substring[j] == substring[k])) 
// 此 时 匹配 ,i、j 都 后 移 

{ 

j++; 

k++ 

next[j] =k; 
} 
else 
{ 

k= next[k]; 

} 


} 


returninfo stringlocate: :KMPlocating(char * target,char # mode) 


{ 


’. 


//KMP 模式 匹配 函数 


int lenmainstring = strlen(mainstring); 
int lensubstring = strlen(substring); 
posi = 0,subposj = 0; 


count2= 0; 
getnext( ); 
while( (posi < lenmainstring) && (subposj < lensubstring) ) 
// 两 个 串 都 没有 完毕 时 
{ 
if((subposj == -1)||(mainstring[posi] == substring[ subposj])) 
// 两 种 位 置 指针 同时 移动 的 情况 
{ 
subposj++; 
Posi+t+; 
} 
else 
{ 
subposj = next[subposj]; 
// 这 种 情况 是 模式 串 回溯 , 主 串 不 动 
} 
// 此 处 统计 比较 次 数 时 ,需要 考虑 (subposj == -1) 不 能 统计 
if(subposj != 一 1) 
count2 ++; // 记 录 比 较 次 数 
} 
if(subposj < lensubstring) // 模 式 串 没有 完毕 说 明 匹 配 失败 
return fail; 
else 


{ 
startpos2 = posi — lensubstring+1; 
return success; 


图 10-18 为 两 种 字符 串 匹 配 算法 比较 程序 运行 界面 。 


查找 程序 设计 进 阶 


247 > 


用 C++ 实现 数据 结构 程序 设计 


图 10-18 两 种 字符 串 匹配 算法 比较 程序 运行 界面 


从 运行 效果 分 析 , 如 果 模 式 串 中 连续 的 一 部 分 多 次 在 主 串 中 出 现时 ,才能 有 明显 的 效率 
提升 。 


10.7 查找 的 应 用 案例 


【应 用 案例 10-1】 高 级 语言 编译 系统 对 变量 名 的 检测 。 

通常 编程 中 变量 必须 先 定义 后 使 用 ,这 样 在 编译 时 就 可 以 对 变量 名 进行 检测 。 每 过 到 
一 个 新 的 变量 名 ,就 会 在 已 有 的 变量 名 表 中 进行 查找 ,而 变量 名 之 间 并 没有 多 少 逻 辑 关 系 。 
但 是 在 语句 量 很 大 的 情况 下 ,变量 数目 也 在 大 量 增加 。 如 何 提高 变量 名 检测 时 的 查找 速度 
就 是 一 个 很 大 的 问题 ,这 个 时 候 哈 希 法 就 能 起 到 很 大 的 作用 。 

【应 用 案例 10-2】 全 国 犯罪 人 员 统 一 管理 查询 系统 。 

如 果 把 全 国 的 犯罪 人 员 信 息 统一 管理 起 来 ,对 于 破案 就 会 有 很 大 的 作用 。 但 这 将 是 “ 海 
量 数据 ,如 要 提高 查找 效率 就 可 以 利用 各 种 查找 技术 。 如 ,身份 证 号 码 就 可 以 使 用 哈 希 法 、 
二 分 法 等 方法 ; 基于 地 址 的 查询 就 可 以 用 分 块 查找 ; 姓名 、 犯 罪 记录 等 信息 还 可 以 使 用 字 
串 查找 等 技术 ; 年 龄 信息 可 能 使 用 范围 查找 ; 如 果 是 查找 同名 的 所 有 罪犯 ,就 用 树 状 结构 
的 遍历 查找 ; 而 手迹 、 脸 型 等 信息 需要 模糊 查询 ; DNA 等 信息 还 需要 更 高 级 的 查找 技术 。 

【应 用 案例 10-3】 互联 网 搜索 引擎 的 研发 。 

基于 互联 网 的 查找 技术 也 是 非常 困难 的 ,因为 不 光 信息 “超级 海量 ”, 而 且 大 量 信息 分 布 
在 全 球 的 成 千 上 万 的 计算 机 中 ,并 不 是 在 内 存 里 。 最 难 的 是 每 天 都 有 大 量 新 的 信息 出 现 , 也 
有 大 量 的 信息 消失 ,如 何 能 保持 最 新 的 查找 结果 是 正确 的 是 一 件 很 困难 的 事 , 这 些 应 用 正 是 
以 查找 技术 作为 基础 的 。 类 似 实用 的 技术 还 有 局 域 网 中 的 信息 查找 .单机 中 信息 的 高 速 查 
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找 等 。 

【应 用 案例 10-4】 公安 系统 使 用 的 一 种 智能 摄像 系统 。 

在 机 场 、 火 车 站 、 商 场 等 人 员 众多 的 场合 ,由 工作 人 员 操 作 锁 定 一 个 目标 人 物 后 ,可 以 自 
动 跟踪 该 人 的 移动 ,甚至 在 移出 该 摄像 头 的 可 摄 范围 后 ,还 可 以 自动 切换 到 另外 一 个 可 以 监 
控 到 目标 的 摄像 头 继续 监控 。 虽 然 人 的 信息 本 身 是 在 立体 的 空间 中 ,但 是 在 计算 机 中 可 以 
简化 为 平面 图 形 来 处 理 。 这 可 以 理解 为 动态 平面 图 形 信息 的 查找 技术 。 

【应 用 案例 10-5】 特种 部 队 使 用 的 一 种 手机 信号 侦查 系统 。 

在 数 十 千 米 之 内 甚至 利用 卫星 技术 在 更 大 的 范围 查找 某 一 部 手机 的 存在 和 位 置 , 如 果 
查找 成 功 还 会 自动 锁定 目标 ,进一步 秘密 接收 所 有 该 部 手机 发 出 或 接收 的 语音 ,短信 、 图 片 
等 信息 ,从 中 进一步 查找 出 有 价值 的 信息 。 这 一 系列 动作 都 是 查找 技术 的 应 用 。 这 可 以 理 
解 为 动态 立体 区 域 信息 的 查找 技术 。 


10.8 本 章 总 结 


本 章 介绍 了 目前 计算 机 界 经 典 的 查找 技术 ,有 折 半 查找 、 分 块 查找 .二 又 排序 树 、 哈 希 表 
与 哈 希 查找 法 。 特 别 是 哈 希 法 的 算法 达到 接近 O(1) 的 时 间 复 杂 度 ,可 以 理解 为 算法 .数据 
结构 .数学 知识 比较 好 的 综合 运用 ,最 后 通过 多 个 案例 介绍 了 查找 操作 的 用 途 。 


习 题 


一 、 原理 讨论 题 

1. 利用 遍历 的 方法 来 进行 查找 ,是 否 都 是 最 好 的 查找 方法 ? 

2. 非 线 性 关系 中 查找 通常 会 遇 到 什么 问题 ? 

3. 哈 希 存储 法 真 的 能 做 到 O(1) 级 的 查找 算法 吗 ? 为 什么 ?你 如 何 评价 ? 

二 、 理 论 基 本 题 

1. 画 出 二 分 查找 法 的 示意 图 。 自 己 给 出 10 个 数据 , 画 出 其 中 一 个 元 素 查 找 成 功 的 
过 程 。 

2. 夯 出 二 又 排序 树 的 生成 示意 图 ,并且 指出 什么 方法 可 以 得 到 排序 的 结果 。 

3. 画 出 数据 序列 39、24、15、7、16、10 的 哈 希 查找 法 。 哈 希 函 数 为 hash(x) 一 x mod 9。 
假设 冲突 采用 挂 链 法 , 画 出 完整 的 示意 图 。 

三 、 编 程 基本 题 

1. 编程 实现 二 分 查找 法 。 

2. 编程 实现 分 块 查找 法 。 

3. 编程 实现 哈 希 查找 ,函数 为 除 留 取 余 法 ,冲突 解决 方案 是 挂 链 法 , 挂 链 时 可 以 分 别 采 
用 头 挂 . 尾 挂 、 排 序 挂 3 种 方式 。 

4. 编程 实现 串 的 查找 。 

四 、 编 程 提高 题 

1. 编制 一 个 英文 字典 查找 模拟 程序 ,要 求 节 省 空间 并 且 可 以 进行 快速 查找 ,关键 是 能 
否 想 出 每 一 个 单词 并 不 单独 存放 的 思路 。 


249 >》 


用 C++ 实现 数据 结构 程序 设计 


2. 编程 进行 汉字 输入 时 词组 的 联想 功能 。 

3. 在 很 多 软件 的 执行 过 程 中 ,都 会 产生 大 量 的 临时 文件 。 如 使 用 Word 进行 文字 处 
理 ,可 以 在 相应 的 文件 夹 下 看 到 所 产生 的 临时 文件 。 这 些 临 时 文件 名 必须 符合 随机 产生 ,但 
是 又 不 能 重 名 ,甚至 不 能 和 该 文件 夹 下 的 所 有 文件 重 名 ,所 以 它 不 可 能 通过 程序 内 部 控制 来 
完成 ,必须 在 外 部 通过 查找 技术 来 排除 重 名 的 可 能 。 编 制 一 个 模拟 程序 ,产生 大 量 的 临时 文 
件 名 ,但 是 不 能 重复 。 
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本 章 介 绍 一 些 更 加 复杂 的 排序 技术 ,包括 折 半 插入 排序 希 尔 排 序 ,快速 排 序 树 形 选 择 
排序 、 堆 排序 、 归 并 排序 基数 排序 等 7 种 。 相 比 前 面 介绍 过 的 几 种 排序 方法 ,它们 更 有 专业 
特点 ,更 多 地 利用 数据 结构 而 不 是 仅仅 利用 算法 的 技巧 ,本 童 的 内 容 较 好 地 体现 了 数据 结构 
的 综合 应 用 。 


了 中 


11.1 引 


本 书 介绍 过 几 种 基本 的 排序 方法 ,它们 有 一 个 共同 特点 ,就 是 “逐步 缩小 待 排 空间 ,每 次 
增加 一 个 已 排 空间 ”。 除 了 数据 结构 都 是 线性 结构 外 ,算法 也 比较 简单 ,多 是 基于 程序 设计 
技巧 ,了 解 了 点 式 思维 的 程序 构造 方法 后 ,算法 都 不 难 理解 。 本 章 将 会 学 习 到 一 些 更 新 奇 的 
方法 ,会 把 算法 更 多 倾斜 到 数据 结构 知识 的 运用 上 ,甚至 其 中 一 种 排序 方法 能 够 不 通过 “ 比 
较 ? 数 据 的 大 小 就 能 完成 排序 。 为 了 方便 设计 ,本 章 把 前 面 的 5 种 排序 集成 在 一 起 ,其 中 一 
个 技巧 就 是 每 次 排序 时 临时 存储 一 份 , 这 样 后 面 的 排序 还 可 以 继续 使 用 原始 数据 。 

【程序 源码 11-1】 复杂 排序 5 种 方法 部 分 源码 ,实际 的 排序 函数 在 下 面 的 讲解 中 陆续 
展开 。 


// 功 能 :复杂 排序 方法 的 功能 演示 
# include < iomanip.h> 
# include < iostream.h> 
# include < windows.h> 
# define MAXNUM 100 // 数 据 个 数 最 大 值 
# define MAXSIZE 1000 // 数 据 本 身 最 大 值 
int flag= 0; // 用 来 标识 待 排 数 据 是 否 产生 
// 排 序 表 对 象 设计 
class listsorting 
€ 
public: 
listsorting(){}; 
~listsorting(){}; 
void create(); // 创 建 对 象 数 据 函 数 
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void copy(listsorting initlist); // 复 制 对 象 数据 函数 
void display(); // 显 示 数 据 函 数 
int binaryfind(int * data, int from，int to, int find); 
// 折 半 查 找 
void halfinsert(); // 折 半 插 入 排序 函数 
int totalnumbers(listsorting initlist); // 希 尔 排序 时 通过 数据 总 数 确定 步 长 取 值 范围 
void shell(int step); // 希 尔 排序 函数 
void quick(); // 快 速 排序 函数 主要 入 口 
int quicksort(int * Data, int n); // 快 速 排序 函数 递归 实现 
void heap(); // 堆 排序 函数 主要 入 口 
void heapadjust( int begin, int end); // 堆 排序 函数 重组 堆 
void merge( ); // 归 并 排序 函数 主要 入 口 
int mergesort (int Data[ ], int n); // 归 并 排序 函数 具体 实现 
private: 
int heapdata[ MAXNUM] ; // 静 态 数组 作为 大 根 堆 线性 表 的 存储 结构 
int data[ MAXNUM]; // 静 态 数组 作为 线性 表 的 存储 结构 
int total; // 数 据 量 


}; 


int listsorting: :totalnumbers(listsorting initlist) // 返 回 数据 总 数 
{ 
return initlist. total; 
’ 
void listsorting: :create() // 创 建 对 象 数据 函数 
{ 
int choice, i; 
char ch; 
if(flag==1) // 代 表 此 时 已 经 有 一 组 建立 好 的 数据 
| 
cout <<" 此 时 系统 已 经 有 一 组 建立 好 的 数据 , 您 确认 想 蔡 换 吗 ?(Y| |y) :"; 
cin>> ch; 
if(ch== 'Y'||ch== 'y') 
flag= 0; 
} 
if(flag== 0) 
{ 
cout <<" 创 建 待 排 数 据 : < 1 > 键盘 输入 <2> 自 动 生成 "<< endl <<" 请 选择 :"; 
cin>> choice; 
switch(choice) 
{ 
Case 1: 
cout <<" 请 输入 您 需要 键盘 输入 待 排 数 据 的 个 数 :"; 
cin>> total; 
cout <<" 请 开始 输入 数据 (提示 : 一 共 "<< total <<" 个 数据 ,用 空格 分 开 ) : "<< endl; 
for(i=0;i<total;i++) 
cin>> data[ i]; 
flag=1; 
break; 
case 2: 
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cout <<" 请 输入 您 需要 系统 产生 待 排 数据 的 个 数 :"; 
cin>> total; 
cout <<" 系 统 自动 产生 "<< total <<" 个 数据 !"<< endl; 


for(i=0;i<total;i++) 


data[ i] = rand( ) % MAXSIZE; // 系 统 给 出 一 个 0 一 MaAXSIZE 的 随机 数 


flag=1; 
break; 
default: 
cout <<" 您 输入 有 误 ! 请 重新 输入 : "<< endl; 
break; 
} 
if(flag==1) 
{ 
cout <<" 待 排 数 据 如 下 .…"<< endl; 
display(); 
cout <<" 待 排 数 据 成 功 建立 !"<< endl; 


} 
else 
{ 
cout <<" 你 已 经 成 功 取消 了 上 述 操作 !"<< endl; 


} 
} 
void listsorting: :copy(listsorting initlist) // 复 制 对 象 数据 函数 
{ 

int i; 


for(i=0;i< initlist.total;i++) 
data[i] = initlist. data[ i]; 
total = initlist. total; 


} 
void listsorting: :display() // 显 示 函 数 
{ 
int i; 
for(i=0;i<total;i+t+) 
cout << setw(5)<< setiosflags(ios: :left)<< data[i]; 
cout << endl; 
} 
int listsorting: :binaryfind(int * data, int from, int to, int find) 
// 折 半 查 找 
if(from > to) 
return from; // 待 找 数据 合适 的 位 置 
if(find == data[ (from+ to)/2]) 
return (from+ to)/2; // 待 找 数据 合适 的 位 置 
else if(find < data[ (fronm + to)/2]) 
// 所 查找 数据 小 于 中 间 数 据 时 ,通过 递归 继续 查找 正确 的 位 置 
return binaryfind(data, from, (from + to)/2— 1,find); 
return binaryfind(data, (from + to)/2+1,to,find); // 返 回 值 , 待 找 数据 合适 的 位 置 
} 
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11.2 折 半 插入 排序 技术 


折 半 插入 排序 (Binary Insert Sorting) 是 直接 插入 排序 的 改进 。 直 接 插入 排序 搬入 位 
置 的 确定 是 通过 对 有 序 表 中 的 数据 逐个 比较 得 到 的 。 既 然 是 有 序 表 , 那 么 就 可 以 改进 为 使 
用 二 分 法 来 确定 插入 位 置 , 即 比较 待 插入 数据 与 有 序 表 中 间 的 数据 ,根据 大 小 比较 的 结果 ， 
就 可 以 确定 要 插入 的 位 置 在 左边 还 是 在 右边 ,之 后 将 有 序 表 一 分 为 二 ,然后 在 其 中 一 个 有 序 
子 表 中 再 重复 进行 ,继续 下 去 直到 要 比较 的 子 表 中 只 有 一 个 数据 时 ,比较 一 次 便 确 定 插入 位 
置 。 由 于 比较 次 数 明显 较 少 ,因此 提高 了 算法 的 效率 。 

这 个 算法 的 前 提 是 使 用 在 数组 等 顺序 存储 结构 中 ,不 能 使 用 链表 存储 结构 ,因为 要 计算 
出 已 排 空间 的 中 间 位 置 。 

通过 折 半 算法 确定 正确 插入 位 置 后 ,把 这 个 位 置 到 已 排 空间 的 最 后 一 个 位 置 的 所 有 数 
据 进行 后 移 ,然后 再 插入 即 可 。 移 动 过 程 类 似 线性 表 的 插入 数据 算法 ,是 反 向 移动 。 这 个 算 
法 不 能 边 比 较 边 移动 数据 。 

图 11-1 是 折 半 插入 排序 的 原理 示意 图 。 


11-1 折 半 插入 排序 的 原理 示意 图 


此 算法 启用 了 双重 循环 ,第 一 重 循环 用 来 控制 把 所 有 数据 扫描 一 饥 ,第 二 重 循环 用 来 控 
制 数据 的 移动 , 故 最 差 时 间 复 杂 度 依 然 为 O(n?)。 当 n 比较 大 时 ,总 排序 码 比较 次 数 比 直 接 
插入 排序 的 最 差 情 况 要 好 得 多 ,但 比 其 最 好 情况 要 差 。 在 元 素 的 初始 排序 已 经 按 排序 码 排 
好 序 或 接近 有 序 时 ,直接 插入 排序 比 折 半 插入 排序 执行 的 排序 码 比较 次 数 要 少 。 折 半 插 和 
排序 的 元 素 移 动 次 数 与 直接 插 和 人 排序 相同 ,依赖 元 素 的 初始 排列 。 折 半 捅 入 排序 是 一 个 稳 
定 的 排序 方法 。 

折 半 插入 排序 算法 函数 如 下 : 


void listsorting: :halfinsert() // 折 半 插 入 排序 函数 
{ 
if(total == 0) 
{ 
cout <<" 暂 时 没有 数据 ! 操 作 失 败 ! "<< endl; 
return ; 
} 
cout <<" 待 排 数 据 是 :"<< endl1; 
display(); 
for(int i =1; i<total; i++) 
{ 
int position = binaryfind(data,0,i-1,data[i]); // 待 找 数据 合适 的 位 置 
int temp = data[i]; 
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for(int j = i-1; j>=position;j--) 


data[j+1] = data[j]; // 从 后 一 位 向 前 一 位 逐次 移动 数据 
if(j != i-1) 
data[position] = temp; // 将 待 找 数据 放 入 合适 的 位 置 


cout <<" 第 "<<i+1<<" 个 数据 "<< temp <<" 找 到 位 置 是 "<< position + 1 <<", 结果 是 :"<< 
display(); 


cout <<" 排 序 任务 完成 !"<< endl1; 


图 11-2 是 折 半 插入 排序 的 运行 图 
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11-2 折 半 插入 排序 的 运行 图 


11.3 希 尔 排序 技术 


希 尔 排序 (Shell's Sort) 被 称 为 “缩小 增 量 排序 ”,1959 年 由 D. L. Shell 提出 , 较 之 前 的 
排序 方法 有 较 大 的 改进 。 和 希 尔 排 序 是 先 确定 一 个 步 长 ,然后 把 这 个 步 长 下 的 所 有 数据 视 同 
为 一 组 ,对 于 同 组 内 所 有 数据 进行 插入 排序 ,之 后 把 步 长 缩小 ,通常 除 以 2。 以 此 类 推 , 直 到 
最 后 步 长 为 1。 它 是 把 较 小 的 数据 尽早 移 到 前 面 去 , 较 大 的 数据 尽早 移 到 后 面 去 ,而 不 要 逐 
个 位 置地 移动 ,这 样 就 提高 了 时 间 效 率 。 

希 尔 排序 思路 的 突破 是 不 再 每 次 缩小 一 个 待 排 空间 ,而 是 尽快 把 数据 初 排 几 次 ,然后 进 
和 人 和 一般 的 插入 排序 。 

希 尔 排序 方法 如 下 : 
(1) 选择 一 个 步 长 序列 stepi ,stepz,…',stepk, 其 中 后 一 轮 的 步 长 一 般 为 上 一 轮 的 一 半 ， 
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stepr =1。 

(2) 按 步 长 序列 个 数 k, 对 序列 进行 k 轮 排序 。 

(3) 每 趟 排序 中 ,根据 对 应 的 步 长 stepi ,将 待 排序 列 分 割 成 若干 长 度 为 m 的 子 序列 ,分 
别 对 各 子 表 进 行 直接 插入 排序 。 当 步 长 因子 为 1 时 整个 序列 作为 一 个 表 来 处 理 。 

图 11-3 为 希 尔 排序 步 长 逐步 减少 的 原理 示意 图 。 第 一 次 增 量 定 为 6, 然后 依次 定 为 3 


和 1。 
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图 11-3 希 尔 排序 技术 的 原理 示意 图 


希 尔 排 序 时 间 效 率 分 析 较 为 困难 ,关键 码 的 比较 次 数 与 记录 移动 次 数 依赖 于 步 长 因子 
序列 的 选取 ,特定 情况 下 可 以 准确 估算 出 关键 码 的 比较 次 数 和 记录 的 移动 次 数 ,在 n 值 较 小 
时 ,效率 比较 高 ,在 n 值 很 大 时 ,如 果 序 列 按 关键 码 基本 有 序 ,效率 较 高 ,其 时 间 效率 甚至 可 
以 提高 到 O(n)。 目 前 暂时 没有 选取 最 好 步 长 因子 序列 的 方法 。 步 长 因子 序列 可 以 有 各 种 
取 法 ,有 取 奇 数 的 ,也 有 取 质 数 的 ,但 需要 注意 步 长 因子 中 除 1 外 没有 公 因 子 , 且 最 后 一 个 步 
长 因子 必须 为 1。 

由 于 它 出 现 了 相隔 很 远 的 数据 比较 且 可 能 发 生 交 换 , 相 同 的 数据 在 不 同 的 轮 次 里 可 以 
处 在 不 同 的 组 之 中 ,也 就 不 能 保证 相同 数据 保持 原来 的 次 序 ,所 以 它 是 不 稳定 的 排序 方法 。 
图 11-3 两 个 49 的 位 置 前 后 已 经 交换 。 


希 尔 排序 算法 函数 如 下 : 
void listsorting: :shell (int step) // 希 尔 排序 函数 
{ 

int temp; 

int w; 

while(step>0) // 步 长 最 小 为 1 


{ 
for(int j= step;j < total;j++) 
{ 
temp = data[ j]; 
w= j— step; 
while( (temp<data[w])&&(w>= 0)&&(w<= total)) 
{ 
data[w+ step] = data[ w]; 
w=w— step; // 缩 小 步 长 的 范围 比较 数据 
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data[w+ step] = temp; 
} 


/* 显示 希 尔 排序 */ 

cout << endl <<" 当 步 长 为 "<< step <<" 时 ,此 时 的 排序 结果 :"<< endl; 
display(); 

cout << endl; 

step = step/2; // 调 整 步 长 


} 
. 


图 11-4 是 希 尔 排序 的 运行 图 


上 


人 
ee ed 


i 
沿 步 长 为 6 时 ， 此 时 的 排序 结 : 


358 334 464 169 Eo 478 467 962 599 


沿 步 长 为 3 时 ， 此 时 的 排序 结果 : 


169 334 464 358 ?724 478 467 962 599 


当 步 长 为 + 时 ， 此 时 的 排序 结果 : 


334 358 464 467 478 569 724 962 


和 排序 成 功 ? 
请 按 任意 键 继续 . - 


图 11-4 和 希 尔 排序 的 运行 图 


11.4 快速 排序 技术 


快速 排序 (Quick Sortb) 是 第 一 次 把 第 一 个 数据 换 到 它 * 正 确 位置 * 上 。 正 确 位置 是 指 它 
左边 所 有 的 数据 都 比 它 小 ,右边 的 数据 都 比 它 大 ,这 样 从 最 后 希望 的 结果 看 它 的 位 置 就 是 正 
确 的 〈 该 数据 被 称 为 支点 ) 。 将 待 排 空间 按 关键 码 以 支点 数据 分 成 两 部 分 称 为 一 次 划分 , 然 
后 用 递归 的 思想 对 于 左右 两 边 的 数据 继续 排序 ,直到 整个 数据 序列 按 关键 码 有 序 排列 ,本 方 
法 的 关键 是 进行 反复 划分 。 

快速 排序 的 突破 点 是 完全 采用 递归 的 思路 进行 排序 。 

图 11-5 为 第 一 轮 快速 排序 的 原理 示意 图 ,递归 工作 类 似 , 不 再 讨论 。 

快速 排序 的 递归 过 程 可 用 生成 一 棵 二 又 树 形象 地 表示 。 由 于 快速 排序 是 递归 的 ,每 层 
递归 调用 时 的 指针 和 参数 均 要 用 栈 来 存放 ,递归 调用 层次 数 与 相应 二 又 树 的 深度 一 致 。 因 
而 ,存储 空间 在 理想 情况 下 为 O(logn) , 即 树 的 高 度 ; 在 最 坏 情况 下 , 即 二 又 树 回 退 到 一 个 
单 链表 ,所 以 为 O(n)。 
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11-5 快速 排序 技术 的 原理 示意 图 
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在 n 个 记录 的 待 排 空 间 中 ,一 次 划分 需要 约 n 次 关键 码 比较 ,时 间 效 率 为 O(n) , 若 设 
T(n) 为 对 n 个 记录 的 待 排 空 间 进行 快速 排序 所 需 的 时 间 。 理 想 情 况 下 ,每 次 划分 ,正好 将 


其 分 成 两 个 等 长 的 子 序列 , 则 


TM Cxnt+2x*T(n/2) 
Cxnt+2x*(Cxn/2+2x*T(n/4)) = 2x*xCxnt4*T(n/4) 
2xCxnt+4x(Cxn/4+ T(n/8)) = 3x*xCxn++8*T(n/8) 


(C 是 一 个 常数 ) 


和 log2nx*Cxn 二 nxT(1) = O(nlog2n) 
递归 算法 的 时 间 效 率 分 析 通 常 还 是 由 递归 法 来 解决 。 
时 间 效 率 最 坏 情 况 在 待 排 空间 正好 是 排序 状态 时 ,就 使 得 每 次 划分 只 能 得 到 一 个 子 空 


间 ,那么 时 间 效 率 降 为 O(n?)。 


快速 排序 是 通常 被 认为 在 同 数量 级 ( 即 OCnlog:n) ) 的 排序 方法 中 平均 性 能 最 好 的 。 若 
初始 状态 已 经 按 关键 码 有 序 或 基本 有 序 ,快速 排序 反而 虹 化 为 冒 泡 排序 。 为 了 提高 这 种 情 
况 的 效率 ,通常 以 “三 者 取 中 法 ”来 选取 支点 记录 ,即将 待 排 空间 的 两 个 端点 与 中 点 3 个 数据 


关键 码 居中 的 调整 为 支点 记录 。 


由 于 在 排序 过 程 中 两 个 距离 很 远 的 数据 发 生 了 交换 ,快速 排序 是 不 稳定 的 排序 方法 。 
图 11-5 中 两 个 59 的 位 置 前 后 已 经 交换 。 


快速 排序 算法 函数 如 下 : 


void listsorting: :quick() 
{ 


// 快 速 排序 函数 


cout << endl <<" 快 速 排序 的 主要 过 程 显示 : "<< endl; 


quicksort(data total); 


cout <<" 快 速 排 序 的 结果 : "<< endl; 


display(); 
} 


int listsorting: :quicksort(int x* Data, int n) 


{ 
int from= 0; 
int to = 了 一 17 
int middle; 
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int position= 0; 
int space; 
if(n<=1) 
return 0; 
while(from< to) 


{ 


if(from== position) 
{ 
if(Data[ position]< Data[ to]) 
' 
to——; 
} 
else if(Data[ position]> Data[ to]) 
1 
// 交 换 数 据 
space = Data[ position]; 
Data[ position] = Data[ to]; 
Data[ to] = space; 
// 显 示 交换 后 的 数据 
cout << endl; 
display(); 
// 记 录 下 位 置 ,然后 继续 向 后 搜索 
position= to; 
fromt+; 
else if(Data[ position] == Data[to]) 
{ 
bo0==# 


} 
} 
else if(position == to) 
{ 
if(Data[ from]> Data[ position]) 
{ 
// 交 换 数 据 
space = Data[ position]; 
Data[ position] = Data[ from]; 
Data[ from] = space; 
// 显 示 交 换 后 的 数据 
cout << endl; 
display(); 
// 记 录 下 位 置 ,然后 继续 向 前 搜索 


position = from; 


一 一 
else if(Data[from]< Data[ position]) 
{ 

from++ 7 
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else if(Data[ from] == Data[ position]) 
{ 
Erom++ 7 
} 
} 

} 
middle = position; 
quicksort(Data, middle); 
quicksort(Data+ middle+1,n- middle— 1); 
return 0; 


} 
图 11-6 是 快速 排序 的 运行 界面 。 
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464 334 358 169 467 478 ?724 962 599 


169 334 358 464 467 478 724 962 568 


358 464 


1 
1 
1 169 334 358 464 467 478 588 962 724 
1 
上 
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图 11-6 快速 排序 的 运行 界面 


11.5 树 形 选择 排序 技术 


树 形 选择 排序 (Tree Select Sort) 是 在 每 一 轮 待 排 空间 中 选取 一 个 关键 码 最 小 的 记录 ， 
也 即 第 一 轮 从 mn 个 数据 中 选取 关键 码 最 小 的 ,第 二 轮 从 剩 下 的 n 一 1 个 中 再 选取 关键 码 最 小 
的 ,直到 整个 序列 的 记录 选 完 。 这 样 ,由 选取 记录 的 顺序 ,就 可 以 得 到 按 关 键 码 有 序 的 序列 。 
这 虽然 和 简单 选择 排序 有 些 类 似 , 但 是 由 于 选取 最 小 值 的 过 程 不 同 , 采 取 的 是 树 形 结构 选择 
的 思路 ,所 以 取 名 树 形 选择 排序 技术 。 

树 形 选 择 排序 技术 的 突破 点 是 用 二 又 树 的 构造 来 进行 排序 。 

这 个 思路 有 些 类 似 锦标 赛 的 比赛 过 程 , 将 n 个 参赛 的 选手 看 成 完全 二 叉 树 的 叶子 结 点 ， 
则 该 完全 二 又 树 有 2n 一 2 或 2n 一 1 个 结 点 。 首 先 , 两 两 进行 比赛 (在 树 中 是 兄弟 之 间 进 行 ， 
否则 轮空 ,直接 进入 下 一 轮 ), 胜 出 的 兄弟 之 间 再 两 两 进行 比较 ,直到 产生 第 一 名 ; 接 下 来 ， 
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将 第 一 名 的 结 点 标记 为 某 个 特殊 值 ,并 从 该 结 点 开始 , 沿 该 结 点 到 根 路 径 上 ,依次 进行 各 分 
枝 结 点 儿子 间 的 比较 ,胜出 的 就 是 第 二 名 ,因为 和 他 比赛 的 均 是 刚刚 输 给 第 一 名 的 选手 。 如 
此 继续 进行 下 去 ,直到 所 有 选手 的 名 次 已 排 定 。 

图 11-7 是 树 形 选择 排序 技术 的 原理 示意 图 。 假 设 数据 都 大 于 或 等 于 0, 于 是 每 一 次 
求 出 最 大 值 后 要 把 该 位 置 标记 为 理论 上 的 “最 小 值 ”, 如 一 1。 结 果 为 : 31、21、16、15, 利 
用 栈 可 以 产生 从 小 到 大 的 排序 结果 ,也 可 以 直接 通过 每 次 产生 最 小 值 来 达到 升序 的 排序 


A A, oh, 


11-7 树 形 选 择 排序 技术 的 原理 示意 图 


图 11-7 中 ,将 第 一 名 的 结 点 置 为 最 小 值 ,与 其 兄弟 比赛 , 胜 者 上 升 到 父 结 点 , 胜 者 与 其 
兄弟 再 比赛 ,直到 根 结 点 ,产生 第 二 名 。 比 较 次 数 为 | logzn | 次 。 其 后 各 结 点 的 名 次 均 是 这 
样 产 生 的 ,所 以 ,对 于 n 个 参赛 选手 来 说 , 即 对 n 个 记录 进行 树 形 选择 排序 ,总 的 关键 码 比 较 
次 数 至 多 为 (n 一 1) | logsn |] 吉 一 1, 故 时 间 复 杂 度 为 O(nlogsn)。 

该 方法 占用 空间 较 多 , 除 需 输出 排序 结果 的 n 个 单元 外 , 尚 需 n 一 1 个 辅助 单元 。 

为 了 提高 时 间 效 率 , 下 面 给 出 一 个 新 的 利用 二 叉 树 理论 构造 的 树 形 结构 排序 算法 。 


11.6 堆 排 序 技术 


设 有 n 个 元 素 的 序列 : Ki ,K,,…,K,, 当 且 仅 当 满 足下 述 关系 之 一 时 , 称 为 堆 。 

(1) Ki 人 Ka ,Ki 宇 Kair1 (i 二 1,2,…, [Ln/2」])。 这 种 情况 被 称 为 大 根 堆 。 

(2) Ki 二 Kz ,Ki 二 Kz (i 二 1,2,…, |n/2」)。 这 种 情况 被 称 为 小 根 堆 。 

首先 把 上 述 数据 看 成 是 一 个 线性 表 , 再 启用 顺序 存储 ( 即 一 维 数组 ) ,定义 中 数据 的 下 标 
可 理解 为 数组 的 下 标 ,为 了 吻合 ,0 下 标 空置 ,从 1 下 标 开始 存放 数据 。 

定义 中 处 于 位 置 1 和 2i 的 数据 比较 ,以 及 处 于 位 置 i 和 2i 十 1 的 数据 比较 ,可 以 联想 起 
“ 满 二 又 树 ” 和 “完全 二 又 树 ” 的 次 序 编号 ,其 中 父子 关系 就 是 i 和 2i\i 和 2i 十 1 的 位 置 关系 ， 
把 上 述 顺序 存储 结构 联想 成 一 棵 完全 二 叉 树 的 顺序 存储 结构 。 

大 根 堆 就 是 任何 一 个 父亲 结 点 都 比 它 存在 的 左 、 右 儿子 结 点 的 值 大 。 根 据 关 系 的 传递 
律 , 如 果 一 批 线性 关系 的 数据 是 大 根 堆 ,对 应 的 完全 二 又 树 的 根 ( 此 处 正好 是 第 一 个 位 置 上 
的 数据 ) 就 是 所 有 数据 中 的 最 大 值 。 不 符合 大 根 堆 的 一 批 数据 如 果 通 过 某 种 方法 变 成 大 根 
堆 ,那么 最 大 值 就 已 经 出 现 , 这 个 数据 也 就 可 以 被 视 为 “已 排 数 据 ”, 到 此 已 经 结束 了 第 一 个 
阶段 的 工作 , 即 “ 初 始 堆 ”的 构造 。 

初始 堆 虽 然 可 以 产生 一 个 最 大 值 .但 是 如 果 保 持 所 有 数据 位 置 不 变 , 则 其 他 数据 的 处 理 
就 不 能 深入 进行 了 ,因为 此 时 它 处 在 整个 二 又 树 根 的 位 置 上 ,为 了 其 他 数据 能 被 继续 处 理 ， 
将 把 这 个 最 大 值 和 最 后 一 个 位 置 上 的 数据 进行 交换 ,那么 这 个 “已 排 空间 ”目前 就 处 在 整个 
数据 区 的 最 后 面 。 

此 时 演变 出 的 二 叉 树 将 不 再 是 大 根 堆 , 如 果 把 最 后 一 个 位 置 的 数据 除外 ,那么 也 就 是 一 
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个 根 的 数据 导致 不 是 大 根 堆 , 因 为 其 他 所 有 数据 都 已 经 在 上 面 一 轮 中 处 理 好 了 。 对 剩 下 的 
“ 待 排 空 间 ” 重 新 组 堆 , 青 次 把 它 变 成 一 个 “大 根 堆 ”, 这 样 就 可 以 产生 一 个 次 大 值 。 重 复 上 面 
的 过 程 就 可 以 达到 排序 的 目标 。 

对 于 大 根 堆 每 一 次 产生 一 个 最 大 值 都 移 放 在 最 后 面 ,必然 产生 升序 排列 ,反之 ,小 根 堆 
可 以 产生 降序 排列 。 

设 有 nm 个 元 素 ,将 这 n 个 元 素 按 关键 码 建成 堆 , 将 堆 顶 元 素 输出 ( 即 对 根 结 点 与 第 n 个 
结 点 进行 交换 ) ,得 到 mn 个 元 素 中 关键 码 最 小 (或 最 大 ) 的 元 素 。 然 后 再 对 剩 下 的 n 一 1 个 元 
素 重 新 建成 堆 , 输 出 堆 顶 元 素 ,得 到 n 个 元 素 中 关键 码 次 小 (或 次 大 ) 的 元 素 。 如 此 反复 ,就 
得 到 一 个 按 关键 码 有 序 的 序列 ,这 个 过 程 被 称 为 堆 排 序 (Heap Sort)。 

根据 上 面 的 讨论 ,实现 堆 排 序 需 解决 两 个 问题 : 

(1) 如 何 将 n 个 元 素 的 序列 按 关 键 码 建成 堆 ( 构 造 初始 堆 )。 

(2) 输出 堆 顶 元 素 后 ,怎样 调整 剩余 的 n 一 1 个 元 素 , 使 其 按 关 键 码 成 为 一 个 新 堆 ( 重 新 
组 堆 )。 

堆 排 序 的 突破 点 是 联合 线性 表 顺 序 存储 和 完全 二 叉 树 顺序 存储 实现 排序 。 

首先 讨论 如 何 构造 初始 堆 。 以 大 根 堆 为 例 , 就 是 从 最 后 一 个 数据 起 ,逐个 往 前 检查 ,在 
每 一 个 子 树 中 不 符合 堆 定 义 的 就 发 生 交换 ,交换 有 3 种 情况 : 

(1) 如 果 根 比 左 儿 子 小 , 比 右 儿子 大 , 则 将 根 和 左 儿子 交换 ,保证 最 新 的 根 是 最 大 的 。 

(2) 如 果 根 比 左 儿 子 大 , 比 右 儿 子 小 , 则 将 根 和 右 儿 子 交换 。 

(3) 如 果 根 比 左 儿 子 、 右 儿子 都 小 , 则 将 根 和 其 中 更 大 的 儿子 交换 。 注 意 在 检查 和 交换 
过 程 中 ,如 果 发 生 了 交换 ,那么 就 要 一 直 再 次 往 下 确认 ,直到 叶子 结 点 。 因 为 如 果 出 现 交换 ， 
本 次 局 部 的 数据 关系 符合 堆 的 定义 ,但 是 下 面 的 堆 却 可 能 被 破坏 。 重复 以 上 过 程 一 直到 根 ， 
最 后 就 出 现 了 大 根 堆 。 

图 11-8 中 为 第 一 次 建 大 根 堆 完毕 的 原理 示意 图 。 
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图 11-8 堆 排 序 构造 初始 堆 过 程 原理 示意 图 


下 面 讨 论 如 何 重新 组 堆 。 这 个 阶段 是 这 种 排序 方法 的 精妙 之 处 ,最 大 值 和 最 后 位 置 的 
一 个 数据 交换 后 ,破坏 大 根 堆 的 元 素 就 是 根 结 点 ,从 根 结 点 开始 重新 比较 和 交换 ,这 一 赵 比 
较 和 交换 将 沿 着 整个 完全 二 又 树 的 根 到 某 一 个 叶子 结 点 进行 (这 个 自 根 结 点 到 叶子 结 点 的 
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图 11-9 为 重组 堆 的 原理 示意 图 。 
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11-9” 堆 排序 重组 堆 过 程 原理 示意 图 


下 面 为 堆 排 序 的 时 间 效 率 分 析 。 设 树 高 为 hb, 则 h=|logsn | 十 1, 从 根 到 叶子 的 筛选 关 
键 字 比较 次 数 至 多 为 2(h 一 1) 次 ,交换 记录 至 多 为 次。 在 建 好 堆 后 ,排序 过 程 中 的 筛选 次 


数 不 超 过 下 式 : 


2(|logs(n 1) | 十 [logsCn-) | 十 … 十 log:2 | ) < 2nlogsn 
建 堆 时 的 比较 次 数 不 超 过 4n 次 ,因此 堆 排 序 最 坏 情 况 下 ,时 间 复 杂 度 也 就 是 O(nlogsn)。 


堆 排 序 算法 函数 如 下 : 


void listsorting: :heap() 
{ 
for(int k=0;k< total;kt++ 
heapdata[k + 1] = data[ 
int i, temp; 
cout << endl <<" 开 始 对 应 的 二 
for(i=1;i<= total;i++) 


// 堆 排序 函数 


) 
k]; 


叉 树 :"<< endl; 


cout << setw(6)<< heapdata[ i]; 
cout << endl <<" 每 次 排列 后 的 结果 是 :"<< endl; 
// 把 heapdata[1..i] 建 成 大 根 堆 , 从 后 面 开始 


for(i= total/2;i> 0; -- i) 
heapadjust (i, total); 
for(i= total;i>1;—— i) 
{ 
temp = heapdata[ 1]; 


heapdata[1] = heapdata[ i]; 


heapdata[ i] = temp; 
heapadjust (1, i— 1); 
, 
i 


// 将 堆 顶 记录 和 当前 未 经 排序 子 序列 heapdata[1..i] 


// 中 的 最 后 一 个 记录 相互 交换 


// 将 heapdata[1..i-1] 重 新 调整 为 大 根 挫 


void listsorting: :heapadjust( int begin, int end) 


{ 


// 已 知 heapdata[ begin..end] 中 除 heapdata[begin] 之 外 均 满 足 堆 的 定义 ， 


// 本 函数 调整 heapdata[ begin] 
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// 使 heapdata[ begin..end] 成 为 一 个 大 根 堆 
int i,value; 
value = heapdata[ begin]; 
for(i=2*begin;i<=end;i* =2) // 沿 关键 字 较 大 的 结 点 向 下 筛选 
{ 
if(i< end&&heapdata[ i]< heapdata[ i+ 1]) 


++i; //i 为 关键 字 较 大 的 记录 的 下 标 
if(value> = heapdata[i]) 
break; //value 应 插入 在 位 置 begin 上 
heapdata[ begin] = heapdata[ i]; 
begin= i; 
} 
heapdata[ begin] = value; // 插 入 


for(i=1;i<= total;i++) 
cout << setw(6)<< heapdata[ i]; 
cout << endl; 
} 


图 11-10 是 堆 排 序 的 运行 图 。 
Re 0 


全 个 元 页 | 

Co 本 纲 
项 光宗， 得 2 ee 洋行 。 

| 应 的 玉树 : 

HL 334 

称 次 排 划 后 的 结 条 是 : 

HL 467 334 seo 


图 11-10 ” 堆 排 序 的 运行 图 


11.7 归并 排序 技术 


二 路 归并 排序 是 将 两 个 有 序 表 合并 为 一 个 新 的 有 序 表 。 

归并 排序 的 突破 点 是 不 再 只 有 一 个 已 排 空 间 , 而 是 同时 启动 多 个 已 排 空 间 , 之 后 逐渐 合 
并 这 些 空间 ,直到 全 部 数据 成 为 一 个 已 排 空间 。 

归并 排序 首先 把 任何 一 个 数字 都 看 成 已 经 排 好 序 的 数据 ,之 后 把 相 邻 的 两 个 已 排序 空 
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间 进 行 合 并 ,继续 保持 有 序 ,这 样 所 有 已 排 空 间 就 变 成 了 长 度 为 2 的 表 。 然 后 重复 这 个 思 
路 ,不 断 地 成 倍 扩 大 这 个 空间 的 长 度 , 直 到 全 部 数据 都 被 合并 在 一 起 。 
归并 排序 算法 关键 是 要 写 出 把 两 个 已 排序 空间 合并 成 一 个 已 排序 空间 的 通用 函数 , 然 
后 反复 调用 它 。 不 过 此 时 数据 并 不 是 分 布 在 不 同 的 存储 结构 中 ,而 是 在 同一 个 存储 结构 中 ， 
这 里 的 “通用 ” 指 的 是 对 下 标 位 置 的 控制 是 通用 的 ,另外 编程 时 要 注意 空间 长 度 可 能 不 同 。 
图 11-11 是 归并 排序 技术 的 原理 示意 图 。 


(59) (11) G0) (63) (01) (17) (07) (05) 
(1 59) (30 63) (0 17D (05 07) 
(1 30 5 6)(I 05 07 17) 
C01 05 07 11 17 30 59 6) 


图 11-11 归并 排序 技术 的 原理 示意 图 


本 算法 需要 一 个 与 原 表 长 度 相 等 的 辅助 数组 空间 ,所 以 空间 复杂 度 为 O(n)。 
对 n 个 元 素 的 表 , 将 这 n 个 元 素 看 作 叶 结 点 , 若 将 两 两 归并 生成 的 子 表 看 作 它们 的 父 结 
点 , 则 归并 过 程 对 应 由 叶子 向 根 生成 一 棵 二 又 树 的 过 程 ,所 以 归并 轮 数 约 等 于 二 又 树 的 高 度 
减 1, 即 logsn, 每 轮 归 并 需要 移动 记录 n 次 , 故 时 间 复 杂 度 为 O(nlog2n)。 
归并 排序 似乎 不 如 其 他 排序 方法 有 特色 ,但 是 它 在 外 排 ( 即 数据 在 外 存 上 ) 的 编程 中 很 
有 用 。 因 为 它 始终 可 以 处 理 其 中 一 部 分 已 经 排序 的 空间 ,这 对 于 外 排 才 是 有 效 的 ,其 他 的 很 
多 排序 方法 都 要 求全 部 数据 一 次 性 进入 内 存 , 本 书 不 讨论 外 排 技 术 , 感 兴趣 的 读者 可 以 参见 
其 他 书籍 。 
归并 排序 算法 函数 如 下 : 
void listsorting: :merge() // 归 并 排序 函数 
{ 
cout << endl <<" 归 并 排序 的 过 程 显示 : "<< endl; 
mergesort(data, total); 
cout <<" 归 并 排序 的 结果 : "<< endl; 
for(int i=0;i<total;i++) 
cout << data[ i]<<' '; 
} 
int listsorting: :mergesort( int Data[ ], int n) 
{ 
int swap; 
int * divide; 
// 传 递 终止 条 件 
if(n==1) 
return 0; 
// 对 数据 进行 分 割 
divide = Data+n- n/2; 
mergesort(Data,n— n/2); 
mergesort(divide, n/2); 
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// 合 并 数据 并 排序 
for(int i=0;i<n/2;it+) 
{ 
for(int j=n-n/2-1+i;j>=0;j-—) 
if(Data[j]<divide[i]) 
break; 
swap= divide[i]; 
for(int k=n-n/2—-1+i;k>j;k-—) 
{ 
Data[k +1] = Data[k]; 
} 
Data[k + 1] = swap; 
// 输 出 结果 
for(i=0;i<total;i+t+) 


cout << data[ i]<<' '; 


cout << endl; 
人 
return 0; 
} 
图 11-12 是 归并 排序 的 运行 图 。 
加 复 妈 拓 序 五 人 方法 lo Es 


归并 排序 的 过 程 显示 ， 

1 467 334 598 169 724 478 358 962 464 
1 334 467 598 169 724 478 358 962 464 
1 334 467 169 598 724 478 358 962 464 
1 169 334 467 59B 724 478 358 962 464 
1 169 334 467 588 478 724 358 962 464 
1 169 334 467 598 358 478 724 962 464 
1 169 334 467 580 358 478 724 464 962 
hh 169 334 467 588 358 464 478 ?724 962 
1 169 334 358 467 5B8 464 478 ?24 962 
了 


1 169 334 358 467 598 464 478 ?24 962 
lLE 序 成 功 t 


请 按 任意 链 继 续 ..-. 
| 


11-12 ”归并 排序 的 运行 图 


11.8 基数 排序 技术 


基数 排序 是 一 种 借助 多 关键 码 排序 的 思想 ,是 将 单 关键 码 按 基数 分 成 “多 关键 码 ”进行 
排序 的 方法 。 
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基数 排序 思路 的 突破 点 是 排序 过 程 不 再 使 用 “比较 ”这 种 基本 操作 ,在 其 中 将 使 用 队列 
数据 结构 。 

例如 ,扑克 牌 中 52 张 牌 的 排序 (大 、 小 王 除 外 ) ,可 按 花色 和 面值 分 成 两 个 字段 ,其 大 小 
关系 约定 为 : 

花色 : 梅花 二 方块 二 红 桃 二 黑 桃 
面值 : PALLELTLEZIZIWO<T<QO<K<Ah 
车 对 扑克 牌 按 花 色 、 面 值 进行 升序 排序 ,得 到 如 下 序列 ，: 
梅花 2,3,…,A, 方 块 2,3,…,A, 红 桃 2,3,…,A, 黑 桃 2,3,…,A 

即 两 张 牌 ,车 花色 不 同 ,不 论 面值 怎样 ,花色 低 的 那 张 牌 小 于 花色 高 的 ,只 有 在 同 花 色情 况 
下 ,大 小 关系 才 由 面值 的 大 小 确定 。 这 就 是 多 关键 码 排序 。 为 得 到 排序 结果 ,下 面 给 出 两 种 
排序 方案 。 

方法 1: 先 对 花色 排序 ,将 其 分 为 4 个 组 , 即 梅花 组 方块 组 、 红 桃 组 . 黑 桃 组 。 再 对 每 个 
组 分 别 按 面值 进行 排序 ,最 后 ,将 4 个 组 连接 起 来 即 可 。 

方法 2: 先 按 13 个 面值 给 出 13 个 编号 组 (2 号 ,3 号 ,…,A 号) ,将 牌 按 面值 依次 放 入 对 
应 的 编号 组 ,分 成 13 堆 。 再 按 花 色 给 出 4 个 编号 组 (梅花 方块. 红 桃 . 黑 桃 ) ,将 2 号 组 中 的 
牌 取 出 分 别 放 入 对 应 花色 组 ,再 将 3 号 组 中 的 牌 取 出 分 别 放 和 人 对 应 花色 组 ，…… ,这 样 ,4 个 
花色 组 中 均 按 面值 有 序 ,然后 ,将 4 个 花色 组 依次 连接 起 来 即 可 。 

设 n 个 元 素 的 待 排序 列 包 含 d 个 关键 码 {k',k?,…,k) , 则 称 序列 对 关键 码 {k! ,k? ,…， 
ks} 有 序 是 指 : 对 于 序列 中 任意 两 个 记录 r[ 训 和 7r[j](1<i 志 j 考 n) 都 满足 下 列 有 序 关系 : 

(Ck! sk? ki) < Ck sk se ka) 

其 中 k! 称 为 最 主 位 关键 码 ,ks 称 为 最 次 位 关键 码 。 

多 关键 码 排序 按照 从 两 个 方向 的 顺序 都 可 以 逐次 排序 ,下 面 分 别 讨论 这 两 种 方法 。 

(1) 最 高 位 优先 (Most Significant Digit first MSD) 法 。 先 按 k! 排序 分 组 ,同一 组 记录 
中 ,关键 码 k: 相等 ,再 对 各 组 按 k? 排序 分 成 子 组 ,之 后 ,对 后 面 的 关键 码 继续 这 样 的 排序 分 
组 ,直到 按 最 次 位 关键 码 k* 对 各 子 组 排序 后 。 再 将 各 组 连接 起 来 , 便 得 到 一 个 有 序 序列 。 
扑克 牌 按 花 色 ` 面 值 排序 中 介绍 的 方法 一 即 MSD 法 。 

(2) 最 低位 优先 (Least Significant Digit first LSD) 法 。 先 从 ka 开始 排序 ,再 对 ke-: 进 
行 排序 ,依次 重复 ,直到 对 k! 排 序 后 便 得 到 一 个 有 序 序列 。 扑 克 牌 按 面值 ,花色 排序 中 介绍 
的 方法 二 即 LSD 法 。 

对 同样 一 批 数 据 , 启 用 最 高 位 优先 和 最 低位 优先 两 种 方法 ,结果 是 否 一 样 ,是 否 都 能 达 
到 用 户 期 望 的 排序 结果 ,读者 可 以 自行 用 一 批 数 据 来 验证 后 得 到 结论 。 

将 关键 码 拆 分 为 若干 项 ,每 项 作为 一 个 “关键 码 ”, 则 对 单 关键 码 的 排序 可 按 多 关键 码 排 
序 方法 进行 。 例 如 ,关键 码 为 4 位 的 整数 ,可 以 每 位 对 应 一 项 , 拆 分 成 4 项 ; 又 如 ,关键 码 由 
5 个 字符 组 成 的 字符 串 ,可 以 将 每 个 字符 作为 一 个 关键 码 。 这 样 拆 分 后 ,每 个 关键 码 都 在 相 
同 的 范围 内 (数字 是 0 一 9 ,字符 是 'a'~'z) , 称 这 样 的 关键 码 可 能 出 现 的 符号 个 数 为 “ 基 ”, 记 
作 RADIX。 如 果 取 数字 为 关键 码 则 * 基 ?为 10, 如 果 取 字符 为 关键 码 则 * 基 ?为 26。 

从 最 低位 关键 码 起 , 按 关键 码 的 不 同 值 将 序列 中 的 数据 “分配” 到 RADIX 个 队列 中 , 然 
后 再 “收集 *。 如 此 重复 d 次 即 可 。 链 式 基数 排序 是 用 RADIX 个 链 队 列 作为 分 配 队列 , 关 
键 码 相 同 的 记录 存 人 同一 个 链 队列 中 ,收集 则 是 将 各 链 队列 按 关键 码 大 小 顺序 链接 起 来 。 
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图 11-13 为 基数 排序 的 原理 示意 图 。 
0 号 队列 0 号 队列 0 号 队列 | 075 | 095 
1 号 队列 | 531 1 号 队列 | 913 1 号 队列 | 126 | 198 
2 号 队列 | 342 2 号 队列 | 223 | 126 2 号 队列 | 223 
3 号 队列 | 673 | 913 | 223 3 号 队列 | 531 | 436 3 号 队列 | 342 
4 号 队列 4 号 队列 | 342 4 号 队列 | 436 
5 号 队列 | 075 | 095 5 号 队列 5 号 队列 | 531 
6 号 队列 | 126 | 436 6 号 队列 6 号 队列 | 673 
7 号 队列 7 号 队列 | 673 | 075 7 号 队列 
8 号 队列 | 198 8 号 队列 8 号 队列 
9 号 队列 9 号 队列 | 095 | 198 9 号 队列 | 913 
第 一 轮 进 队 第 二 轮 进 队 第 三 轮 进 队 


图 11-13 基数 排序 技术 的 原理 示意 图 


数据 的 位 数 不 一 样 时 可 以 把 左边 的 空白 视 为 0, 原 始 数 据 为 : 

(126,342,075,673,198,095,913,436,223,531) 

第 一 次 出 队 后 效果 为 : 

(531,342,673,913,223,075,095,126,436,198) 

第 二 次 出 队 后 效果 为 : 

(913,223,126,531,436,342.673,075,095,198) 

最 后 出 队 后 排序 效果 已 经 出 来 了 : 

(075,095,126,198,223,342,436,531,673,913) 

此 处 进 队 和 出 队 的 轮 次 由 整数 的 最 大 位 数 决 定 。 

下 面 为 基数 排序 的 时 间 效 率 分 析 , 设 待 排 数据 为 n 个 记录 ,digit 个 关键 码 ,关键 码 的 取 
值 范围 为 radix, 则 进行 链 式 基数 排序 的 时 间 复 杂 度 为 O(digit(n 十 radix)) ,其 中 ,一 轮 分 配 的 时 
间 复 杂 度 为 O(n) ,一 轮 收集 的 时 间 复杂 度 为 O(radix) ,一 共 需 要 进行 digit 轮 分 配 和 收集 。 

需要 2radix 个 指向 队列 的 辅助 空间 以 及 用 于 静态 链表 的 n 个 指针 。 

【程序 源码 11-2】 基数 排序 的 程序 设计 部 分 源码 。 在 用 户 没 有 给 原始 数据 就 启动 排 
序 功 能 的 意外 处 理 中 ,本 程序 使 用 默认 基础 数据 来 代替 出 错 返回 ,也 是 一 种 非常 巧妙 的 程序 
设计 方法 。 队 列 的 基本 操作 已 经 给 出 ,这 里 不 再 重复 。 

// 功 能 : 基数 排序 功能 

# include < iomanip. h> 

# include < iostream.h> 


# include < windows.h> 
#include<math.h> 


# define Maxnum 100000 // 设 置 随机 数据 最 大 值 

# define Defaultnumber 10 // 设 置 默 认 数 组 的 大 小 

#define Datawidth 7 // 设 置 显示 数据 宽度 

# define QueueNum 10 // 设 置 10 个 队 , 分 别 保存 0 ~ 9 的 关键 码 
# define Maxsize 1000 // 数 据 量 最 大 限 
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// 标 志 位 ,判断 用 户 是 否 输入 数据 ,没有 输 
// 人 为 0, 有 则 改 为 1 


int defaultdata[ Defaultnumber] = {126,342,75,673,198,95,913, 436, 223, 531}; 


class queuenode; 
class linkqueue; 
class radixsort; 
class interfacebase; 
class radixsort 
{ 
public: 
radixsort(){} 
~radixsort(){} 
int searchmax( ); 
void send( int * datasent, int total); 
void displayresult(); 
void doradixsort(); 
private: 
linkqueue queue[ QueueNum] ; 
int inputdata[ Maxsize]; 
int count; 
int index; 
int max; 
}; 
int radixsort: :searchmax() 
{ 


int maxvalue = inputdata[ 0]; 


for(int i=1;i<count;i++) 
if(maxvalue < inputdata[ i]) 
maxvalue = inputdata[ i]; 
return maxvalue; 


} 
void radixsort: :send(int * datasent, int total) 
€ 

count = total; 

for(int i=0;i<count;i+t+) 

inputdata[ i] = datasent[i]; 
max = searchmax( ); 
for(i=1;;it+) 


{ 
if(max/((int)pow(10,i)) == 0) 
{ 
max= i; 
break; 
} 
} 
index= 1; 


} 
void radixsort: :displayresult() 


// 默 认 数据 
// 队 结 点 对 象 
// 队 操作 对 象 
// 基 数 排序 对 象 
// 菜 单 对 象 
// 基 数 排序 对 象 


// 找 到 数据 中 的 最 大 值 
// 传 递 函 数 

// 显 示 

// 排 序 


// 多 个 队列 ,都 是 链表 队列 
// 接 收 数据 数组 
// 数 据 总 数 

// 进 位 标志 

// 数 据 最 大 位 数 


//maxvalue 用 来 保存 数据 最 大 值 , 初 始 值 
// 为 第 一 个 数据 
// 扫 描 法 确定 最 大 值 


// 传 递 函 数 


// 求 出 数据 中 的 最 大 值 
// 求 出 数据 的 最 大 位 数 


// 从 个 位 开始 进 队 
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{ 
if(!inputdata) 
cout <<" 数 据 还 没有 创建 ."<< endl; 
else 
{ 
doradixsort(); 
cout << endl <<" 排 序 后 数据 是 :"<< endl; 
for(int i=0;i<count;i++) 
{ 
cout << setw(Datawidth)<< inputdata[ i]; 
if((i+1)%10==0) 
cout << endl; 
} 
cout << endl; 
cout <<" == == == == == == == == == == "<< endl; 
cout <<" 基 数 排序 成 功 !!! "<< endl; 
cout <<" == == == == == == == == == == "<< endl; 
} 
和 


void radixsort: :doradixsort() 


{ 


for(int ii=0;1<maxii++) // 根 据 位 数值 控制 循环 次 数 
{ 
for(int j=0;j<count;j++) // 对 所 有 数据 进 队 
{ 
int k= inputdata[ j] % (10 * index)/index; // 队 号 
queue[k]. enqueue( inputdata[ j]); // 按 位 数 从 小 到 大 ,分 别 进 队 
} 
int outqueueindex = 0; // 出 队 数 据 下 标 
for(j= 0;j<QueueNum; j++) // 按 队 号 出 队 
{ 
while(!queue[j]. isempty()) // 判 断 队列 为 非 空 
{ 
inputdata[ outqueueindex++ ] = queue[ j]. getfront(); 
// 取 头 结 点 
queue[ j]. dequeue( ); // 出 队 
} 
} 
index * =10; // 向 高 进位 


/* 显示 进出 队 一 次 后 的 数据 * / 
cout << endl <<" 第 "<< i+ 1 <<" 次 出 队 后 效果 为 : "<< endl; 
for(int k=0;k<count;k++) 


{ 
cout << setw(Datawidth)<< inputdata[k]; 
if((k+1)%10==0) 
cout << endl; 
} 
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图 11-14 是 基数 排序 的 运行 图 


mi 


入 1 次 出 队 后 效果 为 : 
531 342 673 

第 2 次 出 队 后 效果 为 ， 
913 ” 223 126 

第 3 次 出 队 后 效果 为 ， 
5 95 126 


| 徘 序 后 数据 是 : 
75 95 


| 


| 阶 不 输入 数据 ， 默 认 数 据 为 
126 342 75 673 
请 输入 您 的 选择 ，3 


913 


531 


198 


198 


95 


342 


342 
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11-14 基数 排序 的 运行 图 


11.9 本 章 总 结 


531 


作为 数据 结构 重要 应 用 之 一 ,排序 在 程序 设计 中 起 到 了 很 大 的 作用 。 排 序 操作 可 以 使 
数据 集合 为 用 户 提 供 更 多 的 信息 ,所 以 是 很 多 软件 的 基本 功能 之 一 。 本 章 提 供 了 6 种 排序 
方法 的 源码 供 读者 研究 ,它们 从 许多 方面 突破 了 前 面 提 到 的 基本 排序 思路 ,特别 是 基数 排序 
可 以 做 到 不 用 “比较 ”操作 而 只 用 数据 结构 的 操作 ,体现 了 程序 设计 和 数据 结构 之 间 密 切 的 


关系 。 


一 、 原 理 讨 论题 
1. 排序 操作 为 什么 会 是 基础 和 重要 的 操作 ? 
2. 排序 操作 通常 和 数据 结构 会 有 什么 关系 ? 
二 、 理论 基本 题 


>- 上 mo 


. 写 出 重要 的 概念 10 个 。 
.对 于 数据 序列 (45,12,78,35,49,87,26,95) 夯 出 希 尔 排序 的 示意 图 。 
. 数据 同上 , 画 出 快速 排序 的 示意 图 ,并且 指出 主要 靠 什么 机 制 。 

. 数据 同上 , 画 出 树 形 选择 排序 的 示意 图 。 
. 数据 同上 , 画 出 堆 排 序 的 示意 图 。 

. 数据 同上 , 画 出 基数 排序 的 示意 图 。 


习 
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7. 对 数据 序列 (15 ,24,72,35,49,25,64) 进 行 堆 排 序 , 画 出 对 应 的 顺序 存储 示意 图 和 对 
应 的 完全 二 又 树 。 画 出 初始 大 根 堆 。 画 出 初始 大 根 堆 对 应 的 存储 结构 。 画 出 产生 已 排序 空 
间 一 个 数据 的 逻辑 结构 示意 图 。 

三 、 编程 基本 题 
. 编程 实现 折 半 插入 排序 。 

.编程 实现 希 尔 排序 。 

.编程 实现 快速 排序 (递归 和 非 递 归 两 种 )。 
.编程 实现 堆 排 序 。 

.编程 实现 归并 排序 。 
.编程 实现 基数 排序 。 

7. 把 本 章 排序 算法 集中 ,使 用 菜单 进行 管理 ; 要 求 能 适应 各 种 数据 类 型 ; 要 求 把 结果 
输出 到 文件 中 。 

四 、 编 程 提高 题 

1. 文件 名 的 排序 操作 模拟 程序 。 要 求 能 够 处 理 20 个 任意 的 文件 名 , 带 有 后 级 ,排序 有 
文件 名 的 正 序 和 逆序 ,也 可 以 按照 后 组 进行 正 序 和 逆序 显示 。 

2. 火车 站 名 的 排序 程序 。 输 入 全 国 各 地 的 火车 站 名 ,然后 进行 排序 。 

3. 火车 站 之 间 车 票 价 目的 排序 程序 。 输 入 全 国 火车 站 之 间 的 车 票 价格 信息 ,要 求 有 中 
文 站 名 到 下 一 个 中 文 站 名 ,然后 是 价格 信息 ,然后 按照 价格 进行 升序 排序 。 

4. 火车 站 之 间 各 种 信息 的 排序 程序 。 在 上 面 的 程序 中 增加 新 的 数据 处 理 ,首先 要 求 在 
价格 的 基础 上 增加 城市 之 间 的 里 程 数 、 火 车 小 时 数 , 然 后 可 以 对 其 中 的 这 3 项 信息 进行 升序 
和 降序 的 选择 。 

五 、 思 考题 

二 叉 排序 树 用 来 排序 的 方法 。 第 一 个 数据 作为 根 , 之 后 逐一 处 理 其 他 的 每 一 个 数据 ,从 
根 开始 比较 , 当 新 的 数据 比 根 小 时 往 左边 挂 , 比 根 大 或 相等 时 往 右边 挂 , 当 某 个 儿子 不 为 空 
时 ,递归 使 用 上 面 的 构造 方法 。 对 于 二 又 排序 树 , 只 要 用 中 根 遍 历法 ,就 可 以 得 到 一 个 从 小 
到 大 的 排序 结果 。 这 种 排序 方法 基于 二 叉 树 和 遍历 的 算法 。 


wD 
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本 章 主要 讨论 文件 的 逻辑 结构 和 存储 结构 ,其 存储 结构 的 实现 又 分 别 讨论 7 种 方案 : 
顺序 文件 ,索引 文件 .索引 顺序 存 取 方 法 文件 .虚拟 存储 存 取 方 法 文件 直接 存储 文件 ( 散 列 
文件 ) 多重 表 文件 、 倒 排 文件 等 。 


12.1 3 引 


了 中 


本 书 前 面 章 节 介 绍 了 多 种 数据 结构 ,它们 主要 讨论 了 内 存 中 数据 以 及 关系 的 存放 。 由 
于 内 存 的 “ 掉 电 即 失 ” 特 性 ,程序 运行 的 结果 不 能 保存 下 来 被 反复 利用 。 如 果 想 再 次 利用 这 
些 结果 ,最 好 的 办 法 就 是 把 这 些 结果 保存 在 外 存 上 。 外 存 上 的 数据 通常 以 什么 样 的 逻辑 结 
构 和 存储 结构 来 体现 呢 ? 本 章 将 主要 讨论 文件 结构 , 它 首先 是 各 类 数据 结构 的 综合 应 用 ,其 
次 从 历史 的 角度 看 有 多 种 不 同 的 存储 设备 对 文件 结构 都 有 重大 的 影响 。 


12.2 文件 的 逻辑 结构 


文件 (file) 是 由 大 量 性 质 相 同 的 记录 组 成 的 集合 。 

通常 称 存储 在 主 存储 器 (内 存储 器 ) 中 的 记录 集合 为 表 , 称 存储 在 二 级 存储 器 (外 存储 
器 ) 中 的 记录 集合 为 文件 。 和 查找 一 章 讨 论 过 的 “查找 表 ” 的 差别 在 于 “文件 " 指 的 是 存储 在 
外 存储 器 中 的 记录 的 集合 ,其 中 的 记录 是 文件 中 可 以 存 取 的 数据 的 基本 单位 。 

文件 作为 外 存 上 表示 和 处 理 数据 的 逻辑 结构 , 它 的 基本 操作 包括 什么 呢 ? 除了 最 基本 
的 建立 文件 .删除 文件 、 读 取 文 件 、 遍 历 文件 (如 显示 、 打 印 ,播放 文件 等 ), 从 更 深入 的 角度 重 
要 的 操作 还 有 三 大 类 : 检索 、 修 改 、 排 序 等 。 

检索 操作 有 多 种 角度 ,对 顺序 存 取 而 言 , 检 索 操 作为 读 取 “ 当 前 记录 ”的 下 一 个 记录 ; 对 
直接 存 取 而 言 ,检索 操作 为 读 取 第 n 个 记录 ; 另外 还 有 按 关键 字 读 取 , 也 就 是 读 取 其 关键 字 
等 于 给 定 值 的 记录 。 

修改 操作 包括 往 文件 中 插入 一 个 或 一 批 记录 ; 从 文件 中 删除 一 个 或 一 批 记录 ; 更 新 文 
件 中 某 个 或 一 批 记录 的 属性 。 
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排序 操作 为 将 文件 中 的 记录 按照 某 种 次 序 重新 进行 排列 。 

文件 作为 实用 的 数据 结构 ,具体 的 操作 方式 如 下 : 

第 一 种 为 实时 处 理 方式 ,如 飞机 票 订 票 系统 ,面向 全 国 开放 ,必须 保证 数据 的 实时 更 新 。 

第 二 种 为 批量 处 理 方式 ,如 银行 的 事务 处 理 ( 如 汇总 等 ) 文 件 ,一 般 会 等 到 下 班 或 周末 统 
一 处 理 , 而 不 必 每 一 笔 都 实时 处 理 。 

数据 项 为 最 基本 、 不 可 分 的 数据 单位 ,也 是 文件 中 可 使 用 的 数据 的 最 小 单位 。 

从 文件 内 部 构成 的 角度 通常 可 按 其 记录 的 类 型 不 同 把 文件 分 成 两 类 : 操作 系统 文件 和 
数据 库 文件 。 

操作 系统 文件 仅 是 一 维 、 连 续 的 字符 序列 ,无 结构 ,无 解释 。 它 也 是 记录 的 集合 ,这 个 记 
录 仅 是 一 个 字符 组 ,用 户 为 了 存 取 、 加 工 方便 ,把 文件 中 的 信息 划分 成 若干 组 ,每 一 组 信息 称 
为 一 个 逻辑 记录 , 且 可 按 顺 序 编号 。 

数据 库 文件 是 带 有 结构 的 记录 的 集合 ,这 类 记录 是 由 一 个 或 多 个 数据 项 组 成 的 集合 , 它 
也 是 文件 中 可 存 取 的 数据 的 基本 单位 。 

文件 还 可 按 记录 的 另 一 特性 分 为 定 长 记录 文件 和 不 定 长 记录 文件 。 若 文件 中 每 个 记录 
含有 的 信息 长 度 相同 , 则 称 这 类 记录 为 定 长 记录 ,由 这 类 记录 组 成 的 文件 称 作 定 长 记录 文 
件 ; 若 文件 中 含有 信息 长 度 不 等 的 不 定 长 记录 , 则 称 不 定 长 记录 文件 。 

关键 字 是 记录 中 能 识别 不 同 记录 的 数据 项 , 若 该 数据 项 能 唯一 识别 一 个 记录 , 则 称 为 主 
关键 字 , 若 能 识别 多 个 记录 则 称 为 次 关键 字 。 

数据 库 文件 还 可 按 记录 中 关键 字 的 多 少 分 成 单 关 键 字 文件 和 多 关键 字 文件 。 若 文件 中 
的 记录 只 有 一 个 唯一 标识 记录 的 主 关键 字 , 则 称 单 关 键 字 文件 ; 若 文件 中 的 记录 除了 含有 
一 个 主 关 键 字 外 ,还 含有 若干 次 关键 字 , 则 称 为 多 关键 字 文件 ,记录 中 所 有 非 关键 字 的 数据 
项 称 为 记录 的 属性 。 

图 12-1 为 一 个 数据 库 文件 ,每 个 学 生 的 学 习 状况 是 一 个 记录 , 它 由 10 个 数据 项 组 成 。 
与 线性 表 的 不 同 点 为 这 些 数据 是 存储 在 外 存 上 的 。 


姓名 | 学 生 证 号 | 计算 机 | C++ 高 | 数据 | 操作 | 数据 库 | 数据 库 | 软件 | 总 分 
基础 | 级 语言 | 结构 | 系统 | 原理 | 系统 工程 


昔 文 | 2005501 75 78 69 73 80 81 79 535 
沈 武 | 2005502 82 84 83 79 86 74 88 576 
韩 狠 ”| 2005503 85 74 86 81 75 73 82 556 
杨 略 “| 2005504 68 72 81 75 73 80 79 528 
朱 全 | 2005505 81 3 90 78 86 90 88 600 


图 12-1 学 生 考试 成 绩 文 件 范例 


对 于 数据 库 文件 ,通常 有 4 种 查询 方式 。 

(1) 简单 询问 。 查 询 关键 字 等 于 给 定 值 的 记录 。 如 在 图 12-1 中 ,给 定 一 个 学 生 证 号 或 
学 生 姓 名 ,查询 相关 记录 。 

(2) 区 域 询 问 。 查 询 关 键 字 属 某 个 区 域内 的 记录 。 如 查询 某 门 课程 的 成 绩 总 和 ,或 查 
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询 大 于 90 分 的 所 有 成 绩 。 

(3) 函数 询问 。 给 定 关键 字 的 某 个 函数 。 如 查询 总 分 在 全 体 学 生 的 平均 分 以 上 的 记录 。 

(4) 布尔 询问 。 以 上 3 种 询问 用 布尔 运算 组 合 起 来 的 询问 。 如 查询 总 分 在 600 分 以 上 
且 数 据 结构 在 90 分 以 上 的 全 部 记录 。 

文件 是 由 记录 组 成 的 ,记录 也 有 逻辑 结构 和 物理 结构 之 分 。 记 录 的 逻辑 结构 是 指 记录 
在 用 户 或 应 用 程序 员 面 前 呈现 的 方式 ,是 用 户 对 数据 的 表示 和 存 取 方式 。 记 录 的 物理 结构 
是 数据 在 物理 存储 器 上 (如 磁盘 或 磁带 ) 存 储 的 方式 ,是 数据 的 物理 表示 和 组 织 。 

记录 的 物理 结构 有 各 种 各 样 的 组 织 方式 ,其 基本 方式 有 3 种 : 顺序 组 织 、 随 机 组 织 和 链 
组 织 。 

通常 ,记录 的 逻辑 结构 着 眼 于 用 户 使 用 方便 ,而 记录 的 物理 结构 则 考虑 提高 存储 空间 的 
利用 率 和 减少 存 取 记 录 的 时 间 , 它 根 据 不 同 的 需要 及 设备 本 身 的 特性 可 以 有 多 种 方式 。 

逻辑 记录 的 大 小 由 应 用 要 求 决 定 , 物 理 记 录 指 的 是 计算 机 用 一 条 1/O 命令 进行 读 写 的 
基本 数据 单位 ,对 于 固定 的 操作 系统 和 设备 , 它 的 大 小 基本 上 是 固定 不 变 的 。 

在 物理 记录 和 逻辑 记录 之 间 可 能 存在 下 列 3 种 关系 : 

(1) 一 个 物理 记录 存放 一 个 逻辑 记录 。 

(2) 一 个 物理 记录 包含 多 个 逻辑 记录 。 

(3) 多 个 物理 记录 表示 一 个 逻辑 记录 。 

总 之 ,用 户 读 写 一 个 记录 是 指 逻辑 记录 ,查找 对 应 的 物理 记录 则 是 操作 系统 的 职责 。 

一 个 特定 的 文件 采用 何 种 物理 结构 应 综合 考虑 各 种 因素 ,如 存储 介质 的 类 型 .记录 的 类 
型 .大 小 和 关键 字 的 数目 ,以 及 对 文件 主要 进行 何 种 操作 等 。 

下 面 将 具体 讨论 文件 的 存储 结构 ,主要 有 以 下 7 种 : 顺序 文件 ,索引 文件 .索引 顺序 存 
取 方 法 文件 ,虚拟 存储 存 取 方法 文件 、 直 接 存储 文件 ( 散 列 文件 ) 多重 表 文件 、 倒 排 文件 。 这 
些 存储 结构 是 计算 机 在 几 十 年 的 发 展 过 程 中 不 断 出 现 和 完善 的 ,作为 曾经 在 历史 上 比较 有 
名 的 存储 方案 ,是 有 必要 了 解 的 。 在 操作 系统 原理 数据库 系统 原理 等 专业 知识 中 ,将 会 使 
用 到 这 些 基础 知识 。 


12.3 顺序 文件 


外 存 的 介质 在 经 历 了 磁 鼓 ,卡片 、 纸 带 等 后 出 现 了 磁带 ,直到 现在 磁带 依然 是 各 类 大 中 
小 型 计算 机 和 服务 器 的 主要 数据 存储 介质 之 一 。 

这 种 介质 的 特点 是 , 它 上 面 的 记录 必然 按照 一 维 线性 关系 存放 ,好 像 磁带 上 存储 的 歌曲 
一 样 ,一 首 接着 一 首 。 如 果 想 听 第 三 首 ,只 能 依次 听 完 前 两 首 或 者 快 进 ,但 是 不 可 能 跳 过 前 
两 首 歌 的 磁带 。 顺 序 文件 (Sequential File) 就 是 记录 按 其 在 文件 中 的 逻辑 顺序 依次 进入 存 
储 介质 而 建立 的 , 即 顺序 文件 中 物理 记录 的 顺序 和 逻辑 记录 的 顺序 是 完全 一 致 的 。 

在 磁带 之 后 又 出 现 了 磁盘 等 存储 介质 ,而 顺序 文件 也 可 以 使 用 磁盘 来 存储 ,故而 有 两 种 
分 类 。 若 次 序 相继 的 两 个 物理 记录 在 存储 介质 上 存储 位 置 是 相 邻 的 , 称 为 连续 文件 ; 若 物 
理 记录 之 间 的 次 序 由 链表 来 管理 , 称 为 串联 文件 。 

由 于 顺序 文件 是 依次 存放 记录 的 ,所 以 它 是 根据 记录 的 序号 或 记录 的 相对 位 置 来 存 取 
的 文件 组 织 方式 。 其 特点 有 以 下 4 种 。 
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(1) 存 取 第 n 个 记录 ,必须 先 搜索 在 它 之 前 的 n 一 1 个 记录 。 

(2) 插入 新 的 记录 时 只 能 加 在 文件 的 末尾 。 

(3) 车 要 更 新 文件 中 的 某 个 记录 , 则 必须 将 整个 文件 进行 复制 。 

(4) 删除 记录 时 ,只 作 标 记 即 可 。 

顺序 文件 的 优点 是 连续 存 取 的 速度 快 , 故 主要 用 于 进行 顺序 存 取 、 批 量 修改 的 情况 。 如 
银行 业 \ 保 险 业 、 证 券 业 、 航 空 业 等 部 门 ,在 进行 月 报 、 旬 报 、 半 年 报 \ 年 报 等 数据 处 理 或 数据 
备份 时 都 可 能 采用 顺序 文件 。 

磁带 是 一 种 典型 的 顺序 存 取 介质 ,因此 存储 在 磁带 上 的 文件 只 能 是 顺序 文件 。 磁 带 文 
件 适合 于 文件 的 数据 量 极 大 、 平 时 记录 变化 较 少 .只 作 批 量 修改 的 情况 。 在 对 磁带 文件 作 修 
改 时 ,一般 需 用 另 一 条 复制 带 将 原 带 上 不 变 的 记录 复制 一 遍 , 同 时 在 复制 的 过 程 中 插入 新 的 
记录 和 用 更 改 后 的 新 记录 代 蔡 原 记 录 写 人 。 

为 了 修改 方便 ,要 求 待 复制 的 顺序 文件 按 关键 字 有 序 ( 若 非 数 据 库 文 件 , 则 可 将 逻辑 记 
录 号 作为 关键 字 )。 如 果 是 磁盘 上 的 等 长 记录 组 成 的 连续 文件 , 则 可 以 进行 折 半 查找 (但 是 
如 果 文 件 很 大 ,可 能 导致 磁头 来 回 移动 .增加 了 查找 的 时 间 ) ,对 于 不 等 长 记录 的 话 则 可 以 使 
用 分 块 查找 。 

顺序 文件 的 择 入、 删除 和 更 新 操作 在 多 数 情况 下 都 采用 批 处 理 方式 。 通 常 将 顺序 文件 
做 成 有 序 文件 , 称 作 “ 主 文件 ”, 同 时 将 所 有 的 操作 做 成 一 个 事务 文件 (经 过 排序 也 成 为 有 序 
文件 )。 所 谓 “ 批 处 理 ”, 就 是 将 这 两 个 文件 合并 为 一 个 新 的 主 文件 。 具 体操 作 的 思路 类 似 于 
归并 两 个 有 序 表 , 但 有 两 点 不 同 : 

(1) 对 于 事务 文件 中 的 每 个 操作 首先 要 判别 其 合法 性 ; 

(2) 事务 文件 中 可 能 存在 多 个 操作 ,是 对 主 文件 中 同一 个 记录 进行 的 。 

若 顺序 文件 的 修改 量 很 小 ,频率 很 低 , 则 不 适 于 每 一 次 都 进行 批 处 理 , 应 该 采用 附加 文 
件 法 ,逐步 积累 ,等 到 一 定 的 规模 后 再 进行 批 处 理 , 但 是 要 处 理 好 平时 的 查找 过 程 。 

批 处 理 的 时 间 效 率 分 析 : 假设 主 文件 中 含有 N1 个 记录 ,事务 文件 中 含有 N2 个 记录 ， 
则 对 事务 文件 进行 内 部 排序 的 时 间 复 杂 度 为 O(N2 * log(N2)); 内 部 归并 的 时 间 复 杂 度 为 
OCN2 十 N1) , 则 总 的 内 部 处 理 的 时 间 为 O(N2 x log(N2) 十 N1); 假设 对 外 存 进 行 一 次 读 / 取 
N3 个 记录 的 操作 , 则 整个 批 处 理 过 程 中 读 写 外 存 的 次 数 为 2X (N2/N3H[(N2 十 N1)/N3。 


12.4 索引 文件 


在 字符 串 一 章 里 讨论 了 索引 结构 ,这 种 结构 虽然 增加 了 管理 机 构 带 来 的 空间 代价 ,但 是 
在 整体 上 控制 了 数据 移动 带 来 的 时 间 效率 低下 问题 , 堪 称 一 种 比较 完美 的 存储 结构 。 在 文 
件 结构 上 更 能 体现 其 优点 ,因为 此 时 将 面临 的 是 超大 的 空间 管理 。 目 前 数 百 G 甚至 上 千 
G 的 硬盘 已 经 成 为 主流 外 存 设备 。 

除了 文件 本 身 ( 称 作 数据 区 ) 之 外 ,另外 建立 一 张 指示 逻辑 记录 和 物理 记录 之 间 对 应 关 
系 的 表 一 一 索引 表 。 这 类 包括 文件 数据 区 和 索引 表 两 大 部 分 的 文件 就 被 称 作 索引 文件 
(Index File) 。 

索引 表 中 的 每 一 项 称 作 索引 项 。 不 论 主 文件 是 否 按 关键 字 有 序 , 索 引 表 中 的 索引 项 总 
是 按 关 键 字 (或 逻辑 记录 号 ?顺序 排列 ,这 样 可 以 大 大 提高 查找 效率 。 
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若 数据 区 中 的 记录 也 按 关 键 字 顺 序 排列 , 则 称 索引 顺序 文件 。 反 之 , 若 数据 区 中 记录 不 
按 关键 字 顺 序 排列 , 则 称 索 引 非 顺序 文件 。 

索引 表 由 系统 程序 自动 生成 。 在 记录 输入 数据 区 的 同时 建立 一 个 索引 表 。 表 中 的 索引 
项 按 记 录 输 入 的 先后 次 序 排列 , 待 全 部 记录 输入 完毕 后 再 对 索引 表 进 行 排序 。 

图 12-2 为 一 个 索引 表 的 例子 。 标 识 域 指示 该 多 


辑 记录 是 否 存在 ,车 存在 , 则 标识 符 为 1 ,否则 为 0, 表 | 于 | 标 吕 | 物 归 记录 
示 该 记录 已 经 被 删除 。 和 ! 2 

图 12-3 为 索引 非 顺 序 文件 示例 。 第 一 个 表 为 数 ! 
据 文件 ,第 二 个 表 为 文件 输入 过 程 中 建立 的 索引 表 , 第 2 2 
三 个 为 其 索引 表 。 索 引文 件 的 检索 方式 为 直接 存 取 或 2 : 3 


按 关键 字 (进行 简单 询问 ) 存 取 ,检索 过 程 和 分 块 查找 图 12.2 索引 表示 例 
相 类 似 , 分 两 步 进行 , 首先 ,查找 索引 表 , 若 索引 表 上 

存在 该 记录 , 则 根据 索引 项 的 指示 读 取 外 存 上 该 记录 ; 否则 说 明 外 存 上 不 存在 该 记录 ,也 就 
不 需要 访问 外 存 。 


物理 记录 号 | 职工 编号 | 姓名 | 职 务 | 其 他 信 

1024 101 赵 毅 | 程序 开发 员 
1025 813 钱 尔 | 设备 维修 员 
1028 925 “| 孙 善 | 网 络 管理 员 
1030 115 李斯 销售 员 

1034 030 周 武 | 《部门 经 理 
1035 701 吴 柳 | ”办公 文员 
1041 410 郑 琦 | 程序 开发 员 


(文件 数据 区 
关键 | 物理 记录 号 
也 关键 | 物理 记录 
加 . 
101 1024 
1| 030 1034 
813 1025 
101 1024 
925 1028 
115 1030 
115 1030 
2| 410 1041 
030 1034 
701 1035 
701 1035 
813 1025 
410 1041 
3| 925 1028 
(b) 输入 过 程 中 建立 的 索引 表 人) 最 后 的 索引 表 


12-3 索引 非 顺 序 文 件 示例 
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由 于 索引 项 的 长 度 比 记 录 小 得 多 , 则 可 将 索引 表 一 次 读 和 内存 ,由 此 在 索引 文件 中 进行 
检索 只 访问 外 存 两 次 , 即 一 次 读 索引 ,一 次 读 记 录 。 由 于 索引 表 是 有 序 的 , 则 查找 索引 表 时 
可 采用 二 分 查找 法 。 

索引 文件 的 修改 也 相对 比较 容易 。 删 除 一 个 记录 时 , 仅 需 删 去 相应 的 索引 项 ; 插入 一 
个 记录 时 ,应 将 记录 置 于 数据 区 的 末尾 ,同时 在 索引 表 中 合适 的 位 置 上 插入 索引 项 (为 了 提 
高 效率 ,建议 最 好 在 建 索 引 表 时 留 有 一 定 “ 空 位 ?>); 更 新 记录 时 ,应 将 更 新 后 的 记录 置 于 数 
据 区 的 末尾 ,同时 修改 索引 表 中 相应 的 索引 项 (如 果 更 新 后 的 记录 长 度 小 于 或 等 于 原 记 录 长 
度 , 也 可 能 使 用 原来 的 空间 位 置 ) 。 

当 记 录 数 目 很 大 导致 索引 表 也 很 大 时 ,可 能 导致 一 个 物理 块 容纳 不 下 。 这 种 情况 下 查 
阅 索 引 仍 要 多 次 访问 外 存 。 为 此 ,可 以 再 对 索引 表 建 立 一 个 索引 ,为 了 区 分 ,把 这 层 索引 称 
为 查找 表 。 通 常 最 高 可 有 四 级 索引 : 数据 文件 一 一 索引 表 一 一 查找 表 一 一 第 二 查找 表 一 
第 三 查找 表 。 

检索 过 程 从 最 高 一 级 索引 , 即 第 三 查找 表 开 始 , 仅 需 5 次 访问 外 存 。 上 述 多 级 索引 是 一 
种 静态 索引 ,各 级 索引 均 为 顺序 表 结 构 。 其 结构 简单 ,但 修改 很 不 方便 ,每 次 修改 都 要 重组 
索引 。 因 此 , 当 数 据 文件 在 使 用 过 程 中 记录 变动 较 多 时 ,应 采用 动态 索引 。 如 二 又 排序 树 
(或 二 叉 平 衡 树 )、B- 树 以 及 键 树 (关于 “ 键 树 "请 参考 其 他 资料 ) ,这 些 都 是 树 表 结构 ,插入 、 删 
除 操作 都 很 方便 。 又 由 于 它 本 身 是 层次 结构 ,无 须 建 立 多 级 索引 ,建立 索引 表 的 过 程 即 排序 
的 过 程 。 

当 数据 文件 的 记录 数 不 很 多 ,内 存 容量 足以 容纳 整个 索引 表 时 可 采用 二 又 排序 树 ( 或 平 
衡 树 ) 作 索引 ; 反之 , 当 文 件 很 大 时 ,索引 表 ( 树 表 ) 本 身 也 在 外 存 , 则 查找 索引 时 尚 需 多 次 访 
问 外 存 ,并且 访问 外 存 的 次 数 恰 为 查找 路 径 上 的 结 点 数 。 

为 减少 访问 外 存 的 次 数 ,就 应 尽量 减 小 索引 表 的 深度 。 此 时 宣 采 用 m 又 的 B- 树 作 索 引 
表 。m 的 选择 取决 于 索引 项 的 多 少 和 缓冲 区 的 大 小 。“ 键 树 "结构 也 用 作 某 些 特殊 类 型 的 
关键 字 的 索引 表 。 当 索引 表 不 大 时 ,可 采用 双向 链表 作 存 储 结构 (此 时 索引 表 在 内 存 中 ); 
反之 , 则 采用 Trie 树 (字典 树 , 详 见 其 他 资料 ) 。 

由 于 访问 外 存 的 速度 较 内 存 更 慢 , 故 其 花费 的 时 间 比 内 存 查 找 的 时 间 大 得 多 ,所 以 对 外 
存 中 索引 表 的 查找 效能 主要 取决 于 访问 外 存 的 次 数 , 即 索 引 表 的 深度 。 索 引文 件 只 能 是 磁 
盘 文件 。 由 于 数据 文件 中 记录 不 按 关键 字 顺 序 排列 , 则 必须 对 每 个 记录 建立 一 个 索引 项 ,如 
此 建立 的 索引 表 称 为 稠密 索引 。 它 的 特点 是 可 以 在 索引 表 中 进行 预 查找 , 即 从 索引 表 便 可 
确定 待 查 记 录 是 否 存在 或 做 某 些 逻 辑 运 算 。 如 果 数 据 文 件 中 的 记录 按 关键 字 顺 序 有 序 , 则 
可 对 一 组 记录 建立 一 个 索引 项 ,这 种 索引 表 称 为 非 稠密 索引 , 它 不 能 进行 “ 预 查找 ”, 但 索引 
表 占 用 的 存储 空间 少 ,管理 要 求 低 。 


12.5 索引 顺序 存 取 方 法 文件 


索引 顺序 存 取 方法 文件 (Index Sequential Access Method File,ISAM) 是 一 种 专 为 磁盘 
存 取 设计 的 文件 组 织 方式 。 由 于 磁盘 是 以 盘 组 、 柱 面 和 磁道 三 级 地 址 存 取 的 设备 , 则 可 对 磁 
盘 上 的 数据 文件 建立 盘 组 、 柱 面 和 磁道 (磁道 索引 即 为 盘面 索引 ) 三 级 索引 。 

文件 的 记录 在 同一 盘 组 上 存放 时 ,应 先 集中 放 在 一 个 柱 面 上 ,然后 再 顺序 存放 在 相 邻 的 
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柱 面 上 ,对 同一 柱 面 , 则 应 按 盘 面 的 次 序 顺序 存放 。 

每 个 磁道 索引 项 由 两 部 分 组 成 : 基本 索引 项 和 溢出 索引 项 ,如 图 12-4 所 示 。 

每 一 部 分 都 包括 关键 字 和 指针 两 项 ,前 者 表示 该 磁道 中 最 
未 一 个 记录 的 关键 字 ( 在 此 为 最 大 关键 字 ) ,后 者 指示 该 磁道 中 | 关键 | 指 | 关键 | 指 
第 一 个 记录 的 位 置 。 柱 面 索引 的 每 一 个 索引 项 也 由 关键 字 和 指 | 字 | 对 | 字 | 外 
针 两 部 分 组 成 ,前 者 表示 该 柱 面 中 最 未 一 个 记录 的 关键 字 (最 大 | 基本 索引 硕 | 溢出 索引 项 
关键 字 ) ,后 者 指示 该 柱 面 上 的 磁道 索引 位 置 。 柱 面 索引 存放 在 。 图 12.4 磁道 索引 项 结构 
某 个 柱 面 上 , 若 柱 面 索引 较 大 , 占 多 个 磁道 时 , 则 可 建立 柱 面 索 
引 的 索引 一 主 索引 。 

在 ISAM 上 检索 记录 时 , 先 从 主 索引 出 发 找到 相应 的 柱 面 索引 , 再 从 柱 面 索引 找到 记 
录 所 在 柱 面 的 磁道 索引 ,最 后 从 磁道 索引 找到 记录 所 在 磁道 的 第 一 个 记录 的 位 置 ,由 此 出 发 
在 该 磁道 上 进行 顺序 查找 直至 找到 为 止 ; 反之 ,车 找 遍 该 磁道 而 不 存在 此 记录 , 则 表明 该 文 
件 中 无 此 记录 。 

每 个 柱 面 上 还 开辟 有 一 个 溢出 区 ,并 且 磁 道 索引 项 中 有 溢出 索引 项 ,这 是 为 插入 记录 所 
设置 的 。 

由 于 ISAM 中 记录 是 按 关 键 字 顺 序 存放 的 , 则 在 插入 记录 时 需 移动 记录 并 将 同一 磁道 
上 最 未 一 个 记录 移 至 溢出 区 ,同时 修改 磁道 索引 项 。 溢 出 区 通常 可 有 3 种 设置 方法 ; 

(1) 集中 存放 一 一 整个 文件 设 一 个 大 的 单一 的 溢出 区 。 

(2) 分 散 存放 一 一 每 个 柱 面 设 一 个 溢出 区 。 

(3) 集中 与 分 散 相 结合 一 溢出 时 记录 先 移 至 每 个 柱 面 各 自 的 溢出 区 , 待 满 后 再 使 用 
公共 溢出 区 。 

为 了 提高 数据 读 取 的 时 间 效率 和 提高 动态 修改 的 时 间 效率 ,每 个 柱 面 的 基本 区 是 顺序 
存储 结构 ,而 溢出 区 是 链表 结构 。 

最 后 简单 讨论 ISAM 中 柱 面 索引 的 位 置 。 磁 道 索引 通常 放 在 每 个 柱 面 的 第 一 道上 , 屠 
么 柱 面 案 引 是 否 也 放 在 文件 的 第 一 个 柱 面 上 呢 ? 由 于 每 一 次 检索 都 需 先 查找 柱 面 索引 , 则 
磁头 需 在 各 柱 面 间 来 回 移动 ,希望 磁头 移动 距离 的 平均 值 最 小 。 研 究 出 来 的 结论 是 柱 面 索 
引 应 放 在 数据 文件 的 中 间 位 置 的 柱 面 上 。 


12.6 虚拟 存储 存 取 方 法 文件 


虚拟 存储 存 取 方 法 文件 (Virtual Storage Access Method File,VSAM) 利 用 了 操作 系统 
的 虚拟 存储 器 的 功能 ,给 用 户 尽 可 能 提供 方便 , 因为 它 免 除了 用 户 为 读 写 记 录 时 直接 对 外 
存 进行 的 操作 。 对 用 户 来 说 ,文件 只 有 控制 区 间 和 控制 区 域 等 逻辑 存储 单位 ,与 外 存储 器 中 
柱 面 、 磁 道 等 具体 存储 单位 没有 必然 的 联系 。 

VSAM 由 3 部 分 组 成 : 索引 集 、 顺 序 集 和 数据 集 。 用 户 在 存 取 文件 中 的 记录 时 ,不 需 
要 考虑 这 个 记录 的 当前 位 置 是 否 在 内 存 , 也 不 需要 考虑 何 时 执行 对 外 存 进行 读 写 的 
指令 。 

从 索引 文件 的 角度 看 ,数据 集 即 为 主 文件 ,而 顺序 集 和 索引 集 构成 “索引 ”。 文 件 的 记录 
均 存 放 在 数据 集中 ,数据 集 内 含 若 干 控 制 区 域 ,而 控制 区 域内 含 若干 控制 区 间 ,每 个 控制 区 
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间 内 含 一 个 或 多 个 记录 。 数 据 集中 的 一 个 结 点 称 为 控制 区 间 (Control Interval) , 它 是 一 个 
1/O 操作 的 基本 单位 , 它 由 一 组 连续 的 存储 单元 组 成 。 控 制 区 间 的 大 小 可 随 文件 不 同 而 不 
同 , 但 同一 文件 上 控制 区 间 的 大 小 相同 。 每 个 控制 区 间 含 有 一 个 或 多 个 按 关键 字 递 增 有 序 
排列 的 记录 , 且 文 件 中 第 一 个 控制 区 间 中 记录 的 关键 字 最 小 。 

顺序 集 内 存放 的 是 数据 集 的 索引 ,每 个 控制 区 间 有 一 个 索引 项 , 它 由 两 部 分 信息 组 
成 : 该 控制 区 间 中 的 最 大 关键 字 和 指向 该 控制 区 间 的 指针 。 顺 序 集 和 索引 集 一 起 构成 一 
棵 B+ 树 (关于 B+ 树 , 详 见 其 他 资料 ) ,为 文件 的 索引 部 分 。 顺 序 集 本 身 是 一 个 单 链表 ,其 
中 存放 每 个 控制 区 间 的 索引 项 ,而 且 顺 序 集中 的 每 个 结 点 即 为 B 树 的 叶子 结 点 。 若 干 
相 邻 控制 区 间 的 索引 项 形成 顺序 集中 的 一 个 结 点 , 结 点 之 间 用 指针 相连 接 , 而 每 个 结 点 
又 在 其 上 一 层 的 结 点 中 建 有 索引 , 且 逐 层 向 上 建立 索引 ,这 些 高 层 的 索引 项 形成 B+ 树 的 
非 终端 结 点 。 因 此 ,VSAM 既 可 在 顺序 集中 进行 顺序 存 取 , 又 可 从 最 高 层 的 索引 (B+ 树 的 
根 结 点 ) 出 发 进行 按 关键 字 存 取 。 顺 序 集 中 的 一 个 结 点 连同 其 对 应 的 所 有 控制 区 间 形 成 
一 个 整体 , 称 作 控制 区 域 (Control Range) 。 

控制 区 间 是 用 户 进行 一 次 存 取 的 逻辑 单位 ,可 看 成 一 个 逻辑 磁道 。 但 它 的 实际 大 小 
和 物理 磁道 无 关 。 控 制 区 域 由 若干 控制 区 间 和 它们 的 索引 项 组 成 ,可 看 成 一 个 逻辑 柱 
面 。VSAM 初 建 时 ,每 个 控制 区 间 内 的 记录 数 不 足 额定 数 ,并 且 有 的 控制 区 间 内 的 记录 
数 为 零 。 

图 12-5 为 一 个 虚拟 存储 存 取 方法 文件 的 示意 图 ,从 中 可 以 看 出 三 层 的 结构 。 


索引 集 


FE Fs SEE 3 B* 树 
—> —>| 5 顺序 集 
se ! Sis ! a 数据 集 
L J 


控制 区 域 控制 区 域 
12-5 ”虚拟 存储 存 取 方法 文件 示意 图 


在 VSAM 中 ,记录 可 以 是 不 定 长 的 ,在 控制 区 间 中 除了 存放 记录 本 身 以 外 ,还 有 每 个 记 
录 的 控制 信息 (如 记录 的 长 度 等 ) 和 整个 区 间 的 控制 信息 (如 区 间 中 存 有 的 记录 数 等 ) ,控制 
区 间 的 结构 如 图 12-6 所 示 。 在 控制 区 间 上 存 取 一 个 记录 时 需 从 控制 区 间 的 两 端 出 发 同时 
向 中 间 扫 描 。 


记录 | 未 利用 的 | 记录 n 的 控 记录 1 的 控制 区 间 的 
n | 空闲 空间 | 制 信息 | ”| 控制 信息 控制 信息 


记录 1 


12-6 ”控制 区 间 的 结构 示意 图 


VSAM 中 没有 溢出 区 ,解决 插入 的 办 法 是 在 初 建文 件 时 留 下 多 余 的 空间 。 一 是 每 个 
控制 区 间 没 有 填 满 记录 ,而 是 在 最 末 一 个 记录 和 控制 信息 之 间 留 有 空 阶 ; 二 是 在 每 个 控 
制 区 域 中 有 一 些 完 全 空 的 控制 区 间 ,并 在 顺序 集 的 索引 中 指明 这 些 空 区 间 。 当 插入 新 记 
录 时 ,大 多 数 的 新 记录 能 插入 到 相应 的 控制 区 间 内 ,但 要 注意 为 了 保持 区 间 内 记录 的 关 
键 字 自 小 至 大 有 序 , 则 需 将 区 间 内 关键 字 大 于 插入 记录 关键 字 的 记录 向 控制 信息 的 方向 
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移动 。 

如 果 在 若干 记录 插入 之 后 控制 区 间 已 满 , 则 在 下 一 个 记录 插入 时 要 进行 控制 区 间 的 
分 裂 , 即 将 近 一 半 的 记录 移 到 同一 控制 区 域 中 全 空 的 控制 区 间 中 ,并 修改 顺序 集中 相应 
索引 。 

如 果 控 制 区 域 已 经 没有 全 空 的 控制 区 间 , 则 要 进行 控制 区 域 的 分 裂 ,此 时 顺序 集中 的 结 
点 也 要 进行 分 裂 , 因 此 还 要 修改 索引 集中 的 结 点 信息 。 注 意 : 由 于 控制 区 域 较 大 , 故 很 少 发 
生 分 裂 的 情况 。 

在 VSAM 中 删除 记录 时 , 需 将 同一 控制 区 间 中 较 删 除 记录 关键 字 大 的 记录 向 前 移 
动 , 把 空间 留 给 以 后 插入 的 新 记录 。 若 整个 控制 区 间 变 空 , 则 需 修改 顺序 集中 相应 的 索 
引 项 。 

由 此 可 见 ,VSAM 占用 较 多 的 存储 空间 ,一般 只 能 保持 约 75% 的 存储 空间 利用 率 。 
它 的 优点 是 ,动态 地 分 配 和 释放 存储 ,不 需要 对 文件 进行 重组 ,并 能 较 快 地 对 插入 的 记 
录 进 行 查找 ,查找 一 个 后 插入 记录 的 时 间 与 查找 一 个 原 有 记录 的 时 间 是 相同 的 。 为 了 
优化 性 能 ,VSAM 还 使 用 了 一 些 其 他 的 技术 ,如 指针 和 关键 字 的 压缩 .索引 的 存放 技 


12.7 直接 存 取 文 件 


在 前 面 的 查找 技术 中 讨论 过 哈 希 查找 法 ,由 于 其 时 间 效 率 接 近 O(1) ,所 以 是 一 种 非常 
有 特色 的 存储 结构 ,那么 是 否 可 以 用 这 种 思路 来 构建 文件 呢 ? 答案 是 肯定 的 。 

直接 存 取 文件 (Direct Access File) 指 的 是 利用 散 列 法 进行 组 织 的 文件 。 它 类 似 哈 希 
表 , 即 根据 文件 中 关键 字 的 特点 设计 一 种 哈 希 函数 和 处 理 冲 突 的 方法 将 记录 散 列 到 存储 设 
备 上 , 故 又 称 散 列 文件 (Hash File) 。 

为 了 提高 存储 后 的 读 取 效 率 ,与 哈 希 表 不 同 的 是 ,对 于 文件 来 说 ,磁盘 上 的 文件 记录 通 
常 是 成 组 存放 的 。 若 干 记录 组 成 一 个 存储 单位 。 在 散 列 文 件 中 ,这 个 存储 单位 叫 作 “ 桶 ” 
(Bucket) 。 假 如 一 个 桶 能 存放 m 个 记录 , 则 m 个 同义词 的 记录 可 以 存放 在 同一 地 址 的 桶 
中 ,而 当 第 m 十 1 个 同义词 出 现时 才 发 生 * 洪 出 ”。 

处 理 溢 出 也 可 采用 哈 希 表 中 处 理 冲突 的 各 种 方法 ,但 散 列 文件 主要 采用 链 地 址 法 。 
当 发 生 “ 溢 出 ”时 ,需要 将 第 m 十 1 个 同义词 存放 到 另 一 个 桶 中 ,通常 称 此 桶 为 “溢出 桶 ”， 
相对 地 , 称 前 m 个 同义词 存放 的 桶 为 “ 基 桶 ”。 溢 出 桶 和 基 桶 大 小 相同 ,相互 之 间 用 指针 
相 链 接 。 当 在 基 桶 中 没有 找到 待 查 记录 时 ,就 沿 着 指针 所 指 移 到 溢出 桶 中 进行 查找 。 因 
此 ,希望 同一 散 列 地 址 的 溢出 桶 和 基 桶 在 磁盘 上 的 物理 位 置 不 要 相距 太 远 ,最 好 在 同一 
柱 面 上 。 

在 直接 存 取 文件 中 进行 查找 时 ,首先 根据 给 定 值 求 得 哈 希 地 址 ( 即 基 桶 号 ) ,将 基 桶 
的 记录 读 入 内 存 进行 顺序 查找 ,车 找到 关键 字 等 于 给 定 值 的 记录 , 则 查找 成 功 ; 若 基 桶 内 
没有 填 满 记录 或 其 指针 域 为 空 , 则 文件 内 不 含 待 查 记录 , 即 查 找 失败 ; 否则 根据 指针 域 的 
值 将 溢出 桶 的 记录 读 和 内 存 继续 进行 顺序 查找 ,直至 查找 成 功 或 不 成 功 。 因 此 ,总 的 查 
找 时 间 为 : 


Time = expectation * (timebucket 十 timememory) 
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其 中 ,expectation 为 存 取 桶 数 的 期 望 值 ( 相 当 于 哈 希 表 中 的 平均 查找 长 度 ) 。 对 链 地 址 处 
理 溢 出 来 说 ,expectation 王 1 十 loadingfactor/2; timebucket 为 存 取 一 个 桶 所 需 的 时 间 ; 
timememory 为 在 内 存 中 顺序 查找 一 个 记录 所 需 的 时 间 ;loadingfactor 为 装载 因子 。 在 散 
列 文件 中 loadingfactor 二 numrecord / (numbucket * capacitybucket ) ,numrecord 为 文件 的 
记录 数 ,numbucket 为 桶 数 ,capacitybucket 为 桶 的 容量 。 显 然 , 增 加 桶 的 容量 可 减少 装载 
因子 ,也 就 使 期 望 值 减 小 了 ,此 时 虽然 在 内 存 中 顺序 查找 一 个 记录 所 需 的 时 间 增 大 了 ,但 
由 于 timebucket>timememory( 即 远大 于 ) , 则 总 的 时 间 Time 仍然 可 以 减少 。 

在 直接 存 取 文件 中 删除 记录 时 ,和 哈 希 表 一 样 , 仅 需 对 被 删 记录 作 一 标记 即 可 。 

直接 存 取 文 件 的 优点 是 文件 随机 存放 ,记录 不 需 进行 排序 ; 插入 、 删 除 方便 , 存 取 速度 
快 ,不 需要 索引 区 ,节省 存储 空间 。 其 缺点 是 不 能 进行 顺序 存 取 , 只 能 按 关键 字 随 机 存 取 , 且 
询问 方式 限于 简单 询问 ,并 且 在 经 过 多 次 插入 、 删 除 之 后 ,也 可 能 造成 文件 结构 不 合理 , 即 洪 
出 桶 满 而 基 桶 内 多 数 为 被 删除 的 记录 ,此 时 需要 重组 文件 。 


12.8 多 重 表 文件 


多 关键 字 文 件 (MultiKey File) 的 特点 是 ,在 对 文件 进行 检索 操作 时 ,不 仅 对 主 关键 字 进 
行 简单 询问 ,还 经 常 需要 对 次 关键 字 进 行 其 他 类 型 的 询问 检索 。 

如 果 文 件 组 织 中 只 有 主 关键 字 索 引 ,为 回答 这 些 对 次 关键 字 的 询问 ,只 能 顺序 存 取 文 件 
中 的 每 一 个 记录 进行 比较 ,从 而 效率 很 低 。 为 此 ,对 多 关键 字 文件 ,除了 按 以 上 几 节 讨论 的 
方法 组 织 文 件 之 外 , 尚 需 建 立 一 系列 的 次 关键 字 索 引 。 次 关键 字 索 引 可 以 是 稠密 的 ,也 可 以 
是 非 稠密 的 。 索 引 表 可 以 是 顺序 表 , 也 可 以 是 树 表 。 和 主 关键 字 索 引 表 不 同 ,每 个 索引 项 应 
包含 次 关键 字 、. 具 有 同一 次 关键 字 的 多 个 记录 的 主 关键 字 或 物理 记录 号 。 

下 面 分 别 讨论 两 种 多 关键 字 文件 的 组 织 方法 ,一 种 是 多 重 表 文 件 , 另 外 一 种 是 倒 排 

多 重 表 文 件 (Multilist File) 的 特点 是 : 记录 按 主 关键 字 的 顺序 构成 一 个 串联 文件 ,并 建 
立 主 关键 字 的 索引 ( 称 为 主 索引 )。 对 每 一 个 次 关键 字 项 建立 次 关键 字 索 引 ( 称 为 次 索引 )， 
所 有 具有 同一 次 关键 字 的 记录 构成 一 个 链表 。 主 索引 为 非 稠密 索引 ,次 索引 为 稠密 索引 。 
每 个 索引 项 包括 次 关键 字 、 头 指针 和 链表 长 度 。 

图 12-7 所 示 为 一 个 多 重 链表 文件 。 其 中 ,学 号 为 主 关键 字 ,记录 按 学 号 顺序 链接 ,为 了 
查找 方便 ,分 成 3 个 子 链表 ,索引 项 中 的 主 关键 字 为 各 子 表 中 的 最 大 值 。 专 业 、 已 修学 分 和 
选修 课目 (C++ 和 Java 为 两 种 高 级 语言 ,DS 为 数据 结构 ,OS 为 操作 系统 ) 为 3 个 次 关键 字 
项 ,它们 的 索引 如 图 所 示 , 具 有 相同 次 关键 字 的 记录 连接 在 同一 链表 中 。 有 了 这 些 次 关键 字 
索引 , 便 容易 处 理 各 种 次 关键 字 的 询问 。 

若 要 查询 已 修学 分 在 400 分 以 上 的 学 生 , 只 要 在 索引 表 上 查找 400 一 449 这 一 项 ,然后 
从 它 的 链表 头 指针 出 发 , 列 出 该 链表 中 4 个 记录 即 可 。 若 要 查询 是 否 有 同时 选修 C++ 和 
Java 课程 的 学 生 , 则 或 从 索引 表 上 “C++” 的 头 指针 出 发 .或 从 “Java” 的 头 指针 出 发 , 读 出 每 
个 记录 ,查看 是 否 同时 选修 这 两 门 课程 。 从 技巧 上 看 可 先 比较 两 个 链表 的 长 度 , 显 然 应 读 出 
长 度 较 短 的 链表 中 的 记录 。 

多 重 链 表 文 件 易 于 编程 ,也 易于 修改 。 如 果 不 要 求 保持 链表 的 某 种 次 序 , 则 插入 一 个 新 
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物理 记录 号 | 姓名 学 号 专业 已 修学 分 选修 课目 


ol 赵 谢 2005350 | 02 软件 | 02 | 412 | 03 DS |02| Os |03 


02 钱 尔 2005351 | 03 软件 | 07 | 398 | 07 | C++ | 04| Ds | 03 


03 孙 善 2005352 | 04 | 计算 机 | 05 | 436 | 人 | Java | 05| Ds | 04 | 0S |05 


04 李斯 2005353 | 八 应 月 06 | 402 | 08 | C++ |06| DS | 08 
武 2005354 | 06 | 计算 机 | 人 | 384 | 02 | Java | 07 | Os | 09 


06 吴 柳 2005355 | 07 应 月 09 | 356 | 10 | C++ | 07 


07 郑 琦 2005356 | 08 软件 | 08 | 398 | 八 | C++ | 08 | Java | 八 
08 王 德 2005357 | 八 软件 | 八 |1408|01| C++|09| DS | 入 


09 汉 庆 2005358 | 10 应 月 10 | 370 | 05 | C++ | 10 | Os | 入 


10 陈 兰 2005359 | 八 应 月 八 |364 | 09 | C++ | 八 


次 关键 字 | 头 指针 | 长 度 次 关键 字 | 头 指针 | 长 度 
主 关键 字 | 头 指针 次 关键 字 | 头 指针 | 长 度 


350~ | 06 | 6 Cr+ | 0 |7 
2005353 | 01 软 件 | ol | 4 Java | 03 | 3 
2005357 | 05 计算 机 | 03 | 2 40~ | 04 | 4 Ds ol | 5 
2005359 | 09 应 用 | 04 | 4 449 OS ol 4 
人 主 关键 字 素 引 (专业 " 案 引 全- 已 修学 分 案 引 (©) "选修 课 目 "索引 


12-7 多 重文 件 示例 


记录 是 容易 的 ,此 时 可 将 记录 直接 插 在 链表 的 头 指 针 之 后 。 但 是 ,要 删 去 一 个 记录 却 很 烦 
琐 ,需要 在 所 有 次 关键 字 的 链表 中 删 去 该 记录 。 


12.9 倒 排 文件 


倒 排 文 件 和 多 重 表 文件 的 区 别 在 于 次 关键 字 索 引 的 结构 不 同 。 通 常 , 称 倒 排 文件 中 的 
次 关键 字 索 引 为 倒 排 表 , 具 有 相同 次 关键 字 的 记录 之 间 不 设 指针 相连 ,而 在 倒 排 表 中 该 次 关 
键 字 的 一 项 中 存放 这 些 记录 的 物理 记录 号 。 

倒 排 表 作 索引 的 好 处 在 于 检索 记录 较 快 。 特 别 是 对 某 些 询问 ,不 用 读 取 记 录 就 可 得 到 
解答 。 如 询问 “软件 ”专业 的 学 生 中 有 否 选 课程 “Java” 的 , 则 只 要 将 “软件 ”索引 中 的 记录 号 
和 “Java” 索 引 中 的 记录 号 进行 “ 交 ” 的 集合 运算 即 可 ,结果 是 07 号 记录 。 

在 插入 和 删除 记录 时 , 倒 排 表 也 要 作 相 应 修改 。 倒 排 表 中 具有 同一 次 关键 字 的 记录 号 
是 有 序 排列 的 , 则 修改 时 要 作 相 应 移动 ; 若 数 据 文件 为 非 串联 文件 ,而 是 索引 顺序 文件 (如 
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ISAM) , 则 倒 排 表 中 应 存放 记录 的 主 关键 字 而 不 是 物理 记录 号 。 

倒 排 文件 的 缺点 是 维护 困难 。 在 同一 索引 表 中 ,不 同 的 关键 字 其 记录 数 不 同 ,各 倒 
排 表 的 长 度 不 等 ,同一 倒 排 表 中 各 项 长 度 也 不 等 。 上 面 范 例 中 文件 的 倒 排 表 如 图 12-8 
所 示 。 


C++ | 02,04,06,07,08,09, 
10 


软 件 | 01,02,07,08 Java | 03,05, 07 

计算 机 | 03, 05 350~399 | 02. 05. 06, 07, 09, 10 Ds | 01 02, 03, 04, 08 

应 用 | 04,06,09,10 400~449 | 01. 03, 04, 08 OS | 01,03,05,09 
(a) 专业 倒 排 表 (b) 已 修学 分 倒 排 表 (0) 选修 课目 倒 排 表 


图 12-8 倒 排 文件 索引 示例 


12.10 文件 的 应 用 案例 


文件 是 计算 机 应 用 中 的 基本 概念 之 一 ,也 是 数据 存储 最 根本 的 形式 。 

【应 用 案例 12-1】 无 论 是 大 型 .中 型 .小 型 计算 机 还 是 微机 ,数据 在 外 存 上 的 保存 形式 
都 是 文件 。 文 件 是 计算 机 能 够 发 展 到 今天 最 底层 的 技术 之 一 。 

【应 用 案例 12-2】 文件 不 仅仅 是 操作 系统 处 理 数 据 的 必 备 存储 结构 ,也 是 应 用 上 人 敢 辑 
性 的 表现 形式 。 除 了 基础 数据 \ 源 程序 代码 、 可 执行 文件 ,一般 的 字 处 理 文件 外 ,文件 的 表现 
形式 已 经 拓展 到 音乐 、 图 片 ,视频 。 

【应 用 案例 12-3】 数据 处 理 过 程 中 会 有 多 种 文件 结构 和 内 存 数据 联合 使 用 ,共同 完成 
某 种 功能 ,如 纸 面 手写 体 识别 软件 。 首 先 要 求 把 纸 面 上 的 所 有 信息 扫描 到 计算 机 中 构成 图 
片 ,然后 计算 机 处 理 后 形成 ASCII 码 文 件 。 这 里 除了 操作 系统 软件 .扫描 软件 .识别 软件 
外 ,还 会 使 用 到 编辑 软件 .打印 软件 ,网络 传输 软件 等 ,其 中 会 涉及 相当 多 的 文件 结构 。 这 些 
知识 说 明了 数据 结构 的 博大 精深 ,非常 值得 深入 学 习 和 研究 。 


12.11 歌曲 文件 的 数据 结构 


在 各 类 文件 格式 中 ,音频 文件 是 一 种 比较 有 特点 的 文件 。 由 于 可 以 以 “ 听 ” 的 方式 访问 
文件 中 的 数据 ,所 以 在 工作 和 生活 中 很 受 欢迎 ,能 起 到 很 大 的 作用 。 例 如 ,歌曲 和 音乐 的 欣 
赏 ,视频 文件 的 伴音 ,各 类 需要 播放 通知 和 通告 的 场所 (如 火车 站 ) ,可 以 让 盲人 通过 收听 文 
件 内 容 的 方法 使 用 计算 机 等 。 

在 各 类 音频 文件 格式 中 ,MP3 是 较为 常见 的 文件 格式 ,下 面 简单 介绍 。 

MP3 是 MPEG-1 Audio Layer 3 的 简称 ,是 一 种 数字 音频 编码 和 有 损 压缩 格式 。MP3 
技术 大 幅度 降低 音频 文件 存储 所 需要 的 空间 。 它 删除 了 脉冲 编码 调制 (PCM) 音 频数 据 中 
对 人 耳 听觉 不 敏感 的 数据 ,从 而 达到 了 较 高 的 压缩 比 (12 : 1 一 10 : 1)。 也 就 是 说 ,一 分 钟 
CD 音质 的 音乐 ,未 经 压缩 需要 10MB 的 存储 空间 ,而 经 过 MP3 压缩 编码 后 只 有 约 1MB。 
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MP3 在 编码 时 先 对 音频 文件 进行 频谱 分 析 , 然 后 用 过 滤器 滤 掉 噪音 电 平 ,接着 通过 量化 的 
方式 将 剩 下 的 每 一 位 打 散 排列 ,最 后 形成 有 较 高 压缩 比 的 MP3 文件 ,并 使 压缩 后 的 文件 在 
回放 时 也 能 够 达到 接近 原音 源 的 效果 。 

MP3 的 音频 质量 取决 于 它 的 Bitrate 和 Sampling frequency, 以 及 编码 器 质量 。MP3 的 
典型 速度 介 于 128 一 320kb/s。 采 样 频率 也 有 44. 1kHz、48kHz 和 32kHz 三 种 频率 。 比 较 
常见 的 采用 CD 采样 频率 44. 1kHz。 常 用 的 编码 器 是 LAME, 它 是 遵循 LGPL 的 MP3 编 
码 器 ,有 着 良好 的 速度 和 音质 。 

用 一 个 二 进 制 查看 器 (如 Ultra-Edit) 打 开 一 个 MP3 文件 ,就 可 以 看 到 一 大 堆 看 似 杂 乱 
无 序 的 数据 。 这 些 数据 都 是 有 规律 可 循 的 。 

MP3 文件 由 帧 (frame) 构 成 , 帧 是 MP3 文件 的 最 小 组 成 单位 。 每 帧 都 包含 帧 头 , 并 可 
以 计算 帧 的 长 度 。 根 据 帧 的 性 质 不 同 ,文件 主要 分 为 3 个 部 分 : ID3v2 标签 帧 ,数据 帧 和 
ID3vl 标签 帧 。 并 非 每 个 MP3 文件 都 有 ID3v2, 但 是 数据 帧 和 ID3vl 帧 是 必需 的 。ID3v2 
在 文件 头 , 以 字符 串 ID3 为 标志 ,包含 演唱 者 .作曲 .专辑 名 等 信息 ,长 度 不 固定 ,扩展 了 
ID3V1 的 信息 量 。ID3vl 在 文件 结尾 ,以 字符 串 TAG 为 标记 ,其 长 度 是 固定 的 128 字 节 , 包 
含 演唱 者 . 歌 名 ,专辑 名 年份 等 信息 。 

ID3V2 一 共有 4 个 版 本 ,但 流行 的 播放 软件 一 般 只 支持 第 3 版 , 即 ID3V2. 3。 每 个 
ID3V2. 3 的 标签 都 由 一 个 标签 头 和 若干 标签 帧 或 一 个 扩展 标签 头 组 成 。 关 于 曲目 的 信息 
如 标题 .作者 等 都 存放 在 不 同 的 标签 帧 中 ,扩展 标签 头 和 标签 帧 并 不 是 必要 的 ,但 每 个 标签 
至 少 要 有 一 个 标签 帧 。 标 签 头 和 标签 帧 一 起 顺序 存放 在 MP3 文件 的 首部 。 

标签 头 长 度 为 10 字 节 ,位 于 文件 首部 ,其 数据 结构 如 下 : 


char Header[3]; /* 存 储 字符 串 "ID3" */ 

char Ver; /* 版 本 号 ID3V2.3 就 存储 3 * / 

char Revision; /* 副 版 本 号 ,此 版 本 记录 为 0 * / 

char Flag; /* 存 放 标志 的 字 节 ,很 少 用 到 ,可 以 忽略 * / 
char Size[4]; /* 标签 大 小 * / 


标签 大 小 为 4 字 节 ,但 每 个 字 节 只 用 低 7 位 ,最 高 位 不 使 用 ,总 是 0, 其 格式 如 下 : 
03oopoorx OXKKKKKK OXKKKKKK OXKKKKKK 


计算 公式 如 下 : 
ID3V2_frame_size = (int) (Size[0] &. 0x7F) < 21 
| Gint) (Size[1] & 0x7F) < 14 
| Cint) (Size[2J& 0x7F) < 7 
| Cint) (Size[3] & 0x7F) + 10; 
每 个 标签 帧 都 有 一 个 10 字 节 的 帧 头 和 至 少 1 字 节 的 不 固定 长 度 的 内 容 组 成 。 它 们 是 
顺序 存放 在 文件 中 , 巾 各 自 特定 的 标签 头 来 标记 帧 的 开始 。 其 帧 的 结构 如 下 : 


char FrameID[ 4]; /* 用 4 个 字符 标识 一 个 帧 , 说 明 其 内 容 * / 
char Size[4]; /* 帧 内 容 的 大 小 ,不 包括 帧 头 ,不 得 小 于 1x*/ 
char Flags[2]; /* 存放 标志 ,只 定义 了 6 位 x/ 
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常用 帧 标识 : 


TIT2: 标题 
TPE1: 作者 
TALB: 专辑 
TRCK: 音 轨 ,格式 : NMMN 表 示 专 辑 中 第 几 首 ,M 为 专辑 中 歌曲 总 数 
TYER: 年 份 
TCON: 类 型 
COMM: 备注 ,格式 : "eng\0 备注 内 容 ", 其 中 eng 表示 所 使 用 的 语言 


帧 大 小 为 4 字 节 所 表示 的 整数 大 小 。 
ID3V1 的 数据 结构 如 下 : 


char Header[3]; /* 标签 头 必 须 是 TAG, 否则 认为 没有 标签 * / 
char Title[30]; /* 标题 * / 

char Artist[30]; /x* 作者 */ 

char Album[ 30]; /x 专集 */ 

char Year[4]; /x 出 品 年 代 */ 

char Comment[28]; /x* 备注 */ 

char reserve; /* 保留 */ 

char track;; /* 音 轨 */ 

char Genre; /x* 类 型 */ 


最 后 31 字 节 还 存在 另外 一 个 版 本 ,就 是 30 字 节 的 Comment 和 1 字 节 的 Genre。 

有 了 上 述 信息 ,就 可 以 自己 写 代 码 从 MP3 文件 中 抓 取 信息 以 及 修改 文件 名 了 。 如 果真 
的 想 写 一 个 播放 软件 ,还 需要 读 它 的 数据 帧 ,并 进行 解码 。 

数据 帧 的 多 少 由 文件 大 小 和 帧 大 小 来 决定 。 每 个 帧 都 有 一 个 4 字 节 长 的 帧 头 , 接 下 来 
可 能 有 2 字 节 的 CRC 校 验 ,其 存在 由 帧 头 中 的 具体 信息 决定 。 接 着 就 是 帧 的 实体 数据 ,也 
就 是 MAIN_DATA 了 。 

帧 头 长 4 字 节 , 对 于 固定 位 率 的 MP3 文件 ,所 有 帧 的 帧 头 格式 一 样 , 其 数据 结构 如 下 : 


typedef FrameHeader { 


unsigned int sync: 11; // 同 步 信息 
unsigned int version: 2; // 版 本 
unsigned int layer: 2; // 层 
unsigned int error protection: 1; //CRC 校 验 
unsigned int bitrate_index: 4; // 位 率 
unsigned int sampling_frequency: 2; // 采 样 频率 
unsigned int padding: 1; // 帧 长 调节 
unsigned int private: 1; // 保 留 字 
unsigned int mode: 2; // 声 道 模式 
unsigned int mode extension: 2; // 扩 充 模式 
unsigned int copyright: 1; // 版 权 
unsigned int original: 1; // 原 版 标志 
unsigned int emphasis: 2; // 强 调 模 式 


}HEADER, x LPHEADER; 


关于 帧 头 4 字 节 的 详细 使 用 说 明 请 查阅 其 他 资料 ,如 ,MP3 SPEC-IS0 11172-3 AUDIO 
PART。 帧 头 后 面 对 于 标准 的 MP3 文件 来 说 ,其 长 度 是 32 字 节 , 紧 接 其 后 的 是 压缩 的 声音 
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数据 , 当 解 码 器 读 到 此 处 时 就 进行 解码 了 。 

要 解释 的 一 个 概念 是 位 流 (bit stream) 。 平 常 接触 到 的 数据 都 是 整数 ,最 小 的 单位 就 是 
byte, 而 后 者 是 char。 虽 然 也 会 用 一 个 字 节 里 的 不 同位 来 表示 不 同 的 含义 ,但 总 的 来 说 ,在 
输出 数据 的 时 候 还 是 把 它 当 作 一 个 个 字 节 看 待 。 但 对 MP3 这 种 数据 格式 来 说 ,这 是 行 不 通 
的 。 在 解码 时 , 它 的 数据 输入 就 是 一 个 个 比特 流 。 其 中 一 个 或 几 个 比特 会 是 采样 数据 或 者 
信息 编码 。 需 要 从 整个 MAIN_DATA 里 提取 所 需要 的 以 BIT 为 单位 的 参数 和 输入 信号 ， 
从 而 进行 解码 ,所 以 需要 一 个 子 程序 ,getbit(n) ,也 就 是 从 缓冲 中 提取 所 需要 的 位 ,并 形成 
一 个 新 的 整数 作为 输出 。 


12.12 本 章 总 结 


本 章 对 文件 进行 了 初步 介绍 , 它 是 外 存 上 存储 和 处 理 数据 的 最 真实 和 最 现实 的 数据 结 
构 。 在 讨论 文件 结构 的 过 程 中 ,会 用 到 前 面 各 章 提 及 的 数据 结构 基础 知识 。 本 章 的 理论 可 
以 体现 数据 结构 的 综合 性 和 实用 性 。 

顺序 文件 .索引 文件 ,索引 顺序 存 取 方法 文件 .虚拟 存储 存 取 方 法 文件 ,直接 存储 文件 
( 散 列 文件 ) ,多 重 表 文件 、 倒 排 文件 也 都 是 数据 库 系 统 原 理 中 的 基础 术语 。 


习 题 


一 、 原 理 讨论 题 

1. 文件 的 几 种 主要 存储 方式 和 硬件 的 发 展 有 什么 关系 ? 

2. 讨论 内 存 和 外 存 的 主要 差异 ,以 及 在 考虑 外 存 的 数据 存储 结构 时 应 注重 哪些 方面 ? 

二 、 理论 基本 题 

1. 写 出 以 下 概念 的 定义 : 文件 检索、 修改 、 排 序 、 操 作 系 统 文件 数据 库 文件 。 

2. 总 结 顺序 文件 的 特点 。 

3. 总 结 索 引文 件 的 特点 。 

4. 某 一 文件 有 21 个 记录 ,其 关键 字 分 别 为 231,118,435,621,753,258,159,357,012， 
446,359,751,268,248,426,486,328,654,487,861,489。 桶 的 容量 capacitybucket 二 3, 桶 数 
numbucket 二 7。 用 除 留 余 数 法 作 哈 希 函 数 H(key) 二 key Mod 7, 请 画 出 由 此 得 到 的 直接 存 
取 文 件 。 

三 、 编程 基本 题 

1. 开发 一 个 文件 系统 ,管理 学 生成 绩 , 人 数 最 好 不 限 ,要 求 同 时 存储 学 生 的 中 文 名 、 学 
号 ,可 以 处 理 8 门 功课 ,要 求 最 后 能 够 计算 出 每 个 人 的 总 分 和 平均 分 数 、 每 门 课 的 总 分 和 平 
均 分 。 除 了 要 求 在 屏幕 上 进行 显示 外 ,还 要 求 把 所 有 原始 数据 和 计算 结果 存储 在 一 个 文件 
中 。 最 好 为 每 个 人 再 另外 产生 一 个 文件 ,里 面 仅 有 他 (她 ) 本 人 的 成 绩 单 。 在 程序 运行 中 要 
求 有 查询 数据 功能 ,另外 可 能 的 话 提供 每 个 人 的 分 数 排序 和 所 有 学 生 的 总 分 排名 表 。 

2. 编程 对 上 面 的 数据 结构 构造 按照 主 关 键 字 的 索引 文件 ,再 构造 按照 中 文 名 、 总 分 排 
序 的 次 索引 文件 。 

3. 开发 序列 号 文件 的 生成 和 排序 程序 ,约定 某 个 公司 将 要 推出 一 款 软 件 , 为 了 保护 正 
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版 软件 ,要 求 产生 每 个 产品 唯一 的 ,但 是 很 难 破解 的 序列 号 ,尝试 编制 一 个 计算 机 自动 生成 
序列 号 的 程序 ,位 数 至 少 在 8 位 以 上 ,可 以 含 全 部 字母 (有 大 小 写 的 区 别 )、 全 部 数字 ,还 有 常 
用 的 一 些 字符 ,每 一 次 至 少 生成 100 000 个 ,要 求 在 生成 后 进行 排序 ,之 后 输出 在 文件 中 。 

四 、 编 程 提高 题 

开发 程序 标识 符 正确 性 检测 模拟 程序 。 要 求 在 程序 内 部 给 定 一 批 正确 的 标识 符 , 然 后 
打开 一 个 数据 文件 ,其 中 有 一 批 任意 的 字符 串 ,程序 处 理 后 要 求生 成 一 个 新 的 文件 。 其 中 分 
成 两 类 : 一 类 是 符合 标准 的 标识 符 , 要 求 排序 列表 (重复 的 只 写 一 次 ); 另 一 类 是 不 符合 标 
准 的 字符 串 , 要 求 排序 列表 同时 显示 出 现 的 次 数 。 
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backone 
backtwo 
choice 

class 

cls 

color 

count 
currentdata 
fact 
factorial 
fib 

fibloop 
fibrecursion 
flag 
getchar 
hanoi 
hanoinow 
loop 

move 
newnum 
num 
numbernow 


pillar 


后 面 的 第 一 个 变量 
后 面 的 第 二 个 变量 
选择 

对 象 

清 屏 

颜色 

计数 

当前 数据 

阶乘 

阶乘 

斐 波 那 契 数 值 

用 循环 计算 斐 波 那 契 数 值 
用 递归 计算 斐 波 那 契 数值 
标志 位 
获取 一 个 字符 

汉 诺 塔 

汉 诺 塔 现在 的 实例 
循环 

移动 

新 数据 

数据 

数据 现在 的 实例 
支柱 


pillarsource 
pillartarget 
product 
recursion 
result 
setconsoletitle 
Startcalcu 
startmove 


system 


第 2 


addnode 
begin 
calculate 
ch 

char 
clearlist 
clearscreen 
coeff 
create 

data 
dataarray 
deletdata 
deletenode 


deletpart 


源 支 柱 
目标 支柱 
产品 

递归 

结果 

安装 控制 台 
斯 塔 卡尔 库 
开始 移动 
系统 

章 ”线性 表 
增加 结 点 
开始 

计算 

字符 

字符 

清除 线性 表 
清除 屏幕 
系数 

构造 

数据 

数据 数组 
删除 数据 
删除 结 点 
删除 部 分 


* “对 照 表 中 的 词汇 和 变量 名 源 自 于 本 书 附带 的 程序 源码 , 书 中 没有 全 部 出 现 。 
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display 
displayname 
dllinklist 
dllinklistnow 
dlnode 
double 
empty 

enum 

error 

face 

fail 

file 

findlist 
followp 
freep 
getnewnode 
getorder 
halfpos 
headp 
inputdata 
insert 
interfacebase 
interfacenow 
invertlist 
item 

lastp 

length 
linklist 
linklistnow 
list 
listonface 
maxnumofbase 
maxsize 
menuchoice 
midp 

name 

new 
newdlnodep 


newnode 
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显示 

显示 名 称 

双向 链表 
双向 链表 现在 的 实例 
双向 结 点 

双向 的 

空 的 

枚 举 

错误 

面 对 

失败 

文件 

查找 表 

尾随 指针 
自由 区 指针 
获得 新 结 点 
获得 次 序 

中 间 的 位 置 

头 指针 

输入 数据 

插入 

界面 库 

界面 现在 的 实例 
倒 排 表 

数据 项 

最 后 一 个 位 置 的 指针 
长 度 

链表 

链表 现在 的 实例 
线性 表 
界面 上 的 线性 表 
基础 库 中 数据 最 大 值 
最 大 数据 量 
菜单 选择 

中 间 位 置 

名 称 

新 的 

新 的 双向 结 点 指针 
新 结 点 


newnodep 
next 

node 

nowp 

order 
overflow 
position 
pow 

prior 
processmenu 
range 

read 

remove 
replace 
retrieve 
returninfo 
returnvalue 
scanname 
searchp 
seqlist 
seqlistnow 
showinfo 
showmenu 
Site 

size 
sourcedata 
staticlinklist 
staticlinklistnow 
tempaddress 
tempdata 
tempp 
underflow 
userchoice 
using 

value 

write 


wrong 


新 结 点 指针 

下 一 个 结 点 的 地 址 
结 点 

现在 指向 的 指针 
次 序 

上 洲 

位 置 

方 寒 

先前 的 

处 理 菜单 

范围 

读数 据 

去 除 

代替 

检索 

返回 信息 
返回 值 
扫描 名 字 

搜查 指针 
顺序 表 

顺序 表现 在 实例 
显示 信息 

显示 菜单 

方位 

大 小 

源 数据 

静态 链表 
静态 链表 现在 的 实例 
临时 地 址 

临时 数据 

临时 指针 

下 洲 

用 户 选择 

使 用 

价值 

写 

错误 的 
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arraymaxnum 


数组 数据 最 大 数量 


bubblesorting 
copy 
datanumber 
datawidth 


defaultdata 


directinsert sorting 


displaydata 
fromlist 
guardsearching 
initlist 

left 
ltorsearching 
maxnum 
minpos 
mylist 

rand 
rtolsearching 
searchdata 
searching 
searchingnow 
seekdata 

seq 
seqsearching 


附录 ”数据 结构 程序 设计 源码 涉及 英语 词汇 或 变量 名 中 英 对 照 表 


冒 泡 排 序 

复制 

数据 编号 

数据 宽度 

默认 数据 

直接 插入 排序 
显示 数据 

源 表 

带 哨兵 元 素 的 搜索 
表 的 初始 化 

左边 

从 左边 到 右边 的 搜索 
最 大 值 

最 小 位 置 
线性 表 的 实例 
随机 数 

从 右边 到 左边 的 搜索 
搜索 数据 

搜索 

搜索 现在 的 实例 
要 搜索 的 数据 
顺序 

顺序 搜索 


simpleselect sorting 简单 选择 搜索 


time 
total 


workingdata 


datain 

dataout 
destroy 

friend 
getlength 
gettop 
isempty 

isfull 

linkstack 
linkstacklength 


linkstacknode 


时 间 
全 部 的 
工作 数据 
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数据 进入 
数据 输出 
销毁 
朋友 
获得 长 度 
获得 栈 顶 的 值 
是 空 的 吗 
是 满 的 吗 
链 栈 

链 栈 长 度 
链 栈 结 点 


linkstacktop 链 栈 栈 顶 指针 

newdata 新 数据 

newstacksize 新 栈 的 大 小 

pop 栈 顶 元 素 的 弹出 

push 往 栈 里 压 入 元 素 

seqstack 顺序 栈 

stack 栈 

stacknow 栈 现在 的 实例 

stacksize 栈 的 大 小 

stackspace 栈 的 空间 

template 模板 

top 栈 顶 

usednodep 用 完 的 结 点 指针 

yesno 选择 yes 或 no 

第 5 章 队列 

addmenbernum 增加 成 员 数 量 

after 之 后 

aim 目标 

append 追加 

array 数组 

change 改变 

check 检查 

clear 清除 

clearqueue 清除 队列 

front 队 头 

getfront 获得 对 头 

getnode 获得 结 点 

input 输入 

linkqueue 链 队 

linkqueuenow ” 链 队 现在 的 实例 

loopqueue 循环 队列 

loopqueuenow ”循环 队列 的 实例 

numsysconversion 数 制 转 换 

numsyscon- 数 制 转换 的 界面 
versiononface 

queueonface 队列 的 界面 

rear 尾 指针 

tailmaxlenth 队 尾 最 大 长 度 
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第 6 章 串 
beginposition ”开始 位 置 
choose 选择 
endposition 结束 位 置 
filename 文件 名 
free 自 由 的 
freespace 自由 空间 
head 头 
heap 堆 
heapcounter 堆 计 数 器 
heapspace 堆 空 间 
index 索引 
indexmsg 索引 信息 
message 信息 
modify 修改 
msg 信息 
newch 新 的 字符 
newlength 新 长 度 
newstr 新 串 
newstring 新 字符 串 
nownode 结 点 现在 的 实例 
open 打开 
save 存储 


shellexecute 执行 外 部 程序 
shownormal 显示 正常 的 情况 


single 单一 的 
sposition 字符 串 的 位 置 
string 字符 串 
strinsert 字符 串 插 入 
strlen 字符 串 长 度 
strlength 字符 串 长 度 
strmodify 字符 串 修改 
strsearch 字符 串 查 找 
strtraverse 字符 串 遍 历 
Success 成 功 
test 测试 

第 7 章 二 维 数组 
ascii ASCII 编码 
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box 
compress 
datajj 
datarow 
datatype 
dataval 
decompress 
down 
judge 

mat 
matcreat 
matin 
matinput 
matout 
matrixdata 
maxcol 
maxrow 
mybox 
playing 
point 
positionh 
positionl 
record 
replay 
retranspose 
rhigh 
Tight 
roomsize 
row 

term 
testequal 
times 
transpose 
tri 
tricreat 
triin 
triinput 
triout 


triples 


箱子 

压缩 
数据 行 和 列 
数据 行 
数据 类 型 
数据 值 
解压 

向 下 

判断 

和 矩阵 

和 矩阵 构建 
和 矩阵 输入 
矩阵 输入 
和 矩阵 输出 
和 矩阵 数据 
列 的 最 大 值 
行 的 最 大 值 
箱子 现在 的 实例 
玩 

指向 
高 度 的 位 置 
长 度 的 位 置 
记录 

重 玩 

再 转 置 

行 的 高 度 
向 右 或 右边 
房间 大 小 
行 

学 期 
测试 是 否 相 同 
次 数 

转 置 

三 元 组 
三 元 组 构建 
三 元 组 输入 
三 元 组 输入 
三 元 组 输出 
三 元 组 


triplesdata 三 元 组 数据 
wide 宽度 

第 8 章 森林 、 树 与 二 又 树 
addchild 增加 儿子 
answer 回答 
btnode 二 又 树 结 点 
btree 二 叉 树 
btreecount 二 叉 树 计数 器 
btreedata 二 叉 树 数据 
btreedeep 二 叉 树 深度 
btreenow 二 叉 树 现在 的 实例 
buildinorderthread ”构建 中 序 线索 树 
countall 计数 所 有 
countnow 计数 现在 的 实例 
creatbtree 创建 二 叉 树 
createbtree 创建 二 叉 树 
createroot 创建 根 
current 当前 的 
deep 深度 
defaultbtree 默认 二 又 树 
dispbtree 显示 二 叉 树 
father 父亲 
finddata 查找 数据 
findnode 查找 结 点 
firstbracket 第 一 层 括号 
getinformation ”获取 信息 
glist 广义 表 
glists 广义 表 
gliststravel 广义 表 遍 历 
glnode 广义 表 结 点 
haveason 有 一 在 北 乎 
havesonl 有 左 儿子 
havesonr 有 右 儿 子 
havetwosons 有 两 个 儿子 
indent 缩 格 
indenttravel 缩 格式 遍历 显示 
initdata 数据 的 初始 化 
initdeep 深度 的 初始 化 
initrootp 根 指针 的 初始 化 


附录 ”数据 结构 程序 设计 源码 涉及 英语 词汇 或 变量 名 中 英 对 照 表 


inorder 中 序 
inputbtree 输入 二 叉 树 
key 关键 字 
lchild 左 儿子 
leafcount 叶子 计数 器 
leveltree 树 的 层次 
ltag 左 标志 位 
nodenow 结 点 现在 的 实例 
nofather 无 父亲 
nolchild 无 左 儿子 
norchild 无 右 儿 子 
nrinorder 非 递归 中 序 遍 历 
nrpostorder 非 递归 后 序 遍历 
nrpreorder 非 递 归 先 序 遍历 
Parent 父母 
pnow 当前 指针 
rchild 右 儿 子 
rgetcount 右 儿 子 获得 计数 
threadnode 线索 树 结 点 
threadtree 线索 树 
threadtreenow ”线索 树 现在 的 实例 
tree 树 
treeempty 树 是 空 的 吗 
treenode 树 结 点 
usednode 使 用 过 的 结 点 
第 9 章 
adjvexdataarray 邻接 数据 数组 
algraph 一 种 图 
autocreatgraph ”自动 建立 图 
basedata 基础 数据 
beginnode 起 始 结 点 
bfstraverse 广度 优先 搜索 


breadthfirst search ”广度 优先 搜索 
breadthfirvisited 广度 访问 
datafortopological 拓扑 排序 的 数据 


datamark 
datatemp 


defaultedge 


数据 标志 
临时 数据 
默认 边 


defaultedgenum 默认 边 数 


293 > 


用 C++ 实现 数据 结构 程序 设计 


defaultnode 
defaultnodenum 
defaultnodes 
depthfirstsearch 
depthfirvisited 
dodijkstra 
doquicksort 
edgeinsdel 
edgemodify 
edgenum 
edgenumber 
edgenumbernow 
edgeweight 
findedge 
findsmallernum 
graph 

graphdata 
graphempty 
graphnow 
indegree 


inigraph 


默认 结 点 
默认 结 点 数 
默认 结 点 

深度 优先 遍历 
深度 优先 遍历 结 点 访问 过 
做 迪克 斯 特 拉 程 序 
做 快速 排序 程序 
边 的 插入 和 删除 
边 的 修改 

边 数 

边 数 

边 数 现在 的 实例 
边 的 权 值 
查找 边 
查找 小 的 数据 
图 

图 的 数据 

图 是 否 空 

图 现在 的 实例 
人 度 

图 的 初始 化 


initializationofedge ” 边 的 初始 化 


initnext 
initopological 
initpointend 
initpointstart 
initweight 
insertmanynodes 
insertonenode 
insertvertices 
nodearray 
nodecol 
nodedata 
nodeend 
nodeflag 
nodeinsdel 
nodenameend 
nodenameofedge 


nodenamestart 
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下 一 个 边 的 初始 化 
拓扑 排序 的 初始 化 
结束 点 的 初始 化 
起 始点 的 初始 化 
权 的 初始 化 
插入 多 个 结 点 
插入 一 个 结 点 
插入 顶点 

结 点 数组 

结 点 列 数 

结 点 数据 

结 点 尾部 
结 点 标志 位 

结 点 插入 和 删除 
尾部 结 点 名 
边 的 结 点 名 
开始 结 点 名 


nodeposition 结 点 位 置 


noderow 结 点 行 数 
nodesarray 结 点 数组 
nodestart 结 点 开始 


nodetoarraydata 结 点 转 入 数组 数据 
numofedges 边 数 


Operator 操作 符 
pointend 结束 点 
pointstart 开始 点 
prim 普 里 姆 算法 
printchar 显示 字符 
searchnext 搜索 下 一 个 


sortednodes 排序 的 结 点 
stackarray 栈 数组 

table 表 
tbfstraverse 广度 优先 遍历 
tdfstraverse 深度 优先 遍历 
tempbigger 临时 的 更 大 值 
tempcount 临时 计数 器 
tempnodeend 临时 结束 结 点 
tempnodestart “临时 开始 结 点 


tempvalue 临时 值 
tempweight 临时 权 值 
topological 拓扑 
topologicalsort ”拓扑 排序 
vertices 顶点 

visit 访问 标准 
visited 已 经 访问 
visitednum 访问 的 结 点 数 
weight 权 


第 10 章 查找 进 阶 
balancefactor 平衡 因子 
balancetree 平衡 树 
bflocating 平衡 因子 定位 
buildtree 生成 树 
creatnode 创建 结 点 
defaultmainstring 默认 主 串 
defaultnum 缺 省 数值 
defaultsubstring 缺 省 子 串 


附录 ”数据 结构 程序 设计 源码 涉及 英语 词汇 或 变量 名 中 英 对 照 表 


displayarraydata 显示 数组 数据 
displayhashtable 显示 哈 希 表 


displaytimes 
ebalance 
fbnq 


fbnqnum 


fibonaccisearching 


force 
freenodespace 
getnext 
halfrsearching 
halfsearching 
hash 
hashanumber 
hashsearching 
hashtable 
inordersearch 
kmplocating 
lchild 
leftbalance 
lenmainstring 
lensubstring 
mainstring 
maxstringlen 
mid 

mode 
modvalue 
mymenunow 
nodevalue 
postorder 
preorder 
printbstree 
printmenu 
rightbalance 


rotate 


显示 次 数 
因子 平衡 

斐 波 那 契 

斐 波 那 契 数值 
斐 波 那 契 查找 
力度 
自由 结 点 空间 
获得 下 一 个 
二 分 搜索 递归 法 
二 分 搜索 
散 列 

散 列 数值 

散 列 搜索 

喻 希 表 

中 序 搜索 
KMP 查找 
左 儿子 

左 平衡 因子 
主 串 长 度 

子 串 长 度 
主 串 
最 大 串 长 
中 间 

模式 

模式 值 

我 的 菜单 现在 的 实例 
结 点 值 

后 序 

先 序 
显示 该 二 又 树 
显示 菜单 
权利 平衡 
旋转 


select 
selectmenu 
setarraynull 
shorter 
showdefaultdata 
showstring 
showtestdata 
taller 

target 


testdata 
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binaryfind 
datasent 
displayresult 
divide 
doradixsort 
halfinsert 
heapadjust 
heapdata 
listsorting 
merge 
mergesort 
outqueueindex 
quick 
quicksort 
radix 
radixsort 
searchmax 
shell 

space 

step 

swap 


totalnumbers 


选择 

选择 菜单 

把 数组 设置 空 
更 短 的 

显示 默认 数据 
显示 字符 串 
显示 测试 数据 
更 高 的 

目标 

试验 数据 
章 排序 进 阶 
二 分 查找 
数据 已 发 送 的 
显示 结果 
分 开 

作 基 数 排序 
中 点 插入 

堆 调 整 

堆 数 据 

表 排 序 

归并 

归并 排序 
输出 队列 索引 
快速 的 
快速 排序 
基数 

基数 排序 
搜索 最 大 值 
Vi 

空间 

步 

交换 

总 数 
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